달력

11

« 2019/11 »

  •  
  •  
  •  
  •  
  •  
  • 1
  • 2
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30




 

 

다차원 실수형 데이터 시각화

·         3차원 이상의 데이터라면 seaborn 패키지의 pairplot()메소드를 사용합니다.

·         pairplot() 데이터프레임을 인수로 받아 그리드(grid) 형태로 데이터 열의 조합에 대해 스캐터 플롯(Scatter plot) 그리며 같은 데이터가 만나는 대각선 영역에는 해당 데이터의 히스토그램을 그려줍니다.

 

 

 

 

pairplot()

·         데이터프레임을 인수로 받아 그리드(grid) 형태로 데이터 열의 조합에 대해 스캐터 플롯을 그립니다.

·         같은 데이터가 만나는 대각선 영역에는 해당 데이터의 히스토그램을 그립니다.

·         카테고리형 데이터가 섞여 있는 경우에는 hue 인자에 카테고리 변수 이름을 지정하여 카테고리 값에 따라 색상을 다르게 있습니다.

 

seaborn.pairplot(data, hue=None, hue_order=None, palette=None, vars=None, x_vars=None, y_vars=None, kind='scatter', diag_kind='auto', markers=None, height=2.5, aspect=1, dropna=True, plot_kws=None, diag_kws=None, grid_kws=None, size=None)

 

인자

설명

data

·         대상이 되는 데이터프레임을 지정합니다.

hue

·         카테고리 변수 이름을 지정

·         hue 인수에 카테고리 변수 이름을 지정하여 카테고리 값에 따라 색상을 다르게 있습니다.

markers

·         마커 모양을 지정합니다.

 

 

http://seaborn.pydata.org/generated/seaborn.pairplot.html


 


'Development > Python' 카테고리의 다른 글

else 블록  (0) 2019.11.07
plt.imshow()  (0) 2019.11.06
다차원 실수형 데이터 시각화, seaborn.pairplot()  (0) 2019.11.05
주피터 노트북(Jupyter Notebook)  (0) 2019.11.04
deck.gl - 위치 데이터 시각화 라이브러리  (0) 2019.11.03
WordCloud for Python  (0) 2019.11.02
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

선형대수학의 데이터의 유형

선형대수에서 다루는 데이터는 개수나 형태에 따라 크게 스칼라, 벡터, 행렬의 세 가지 유형으로 나눌 있으며 데이터 사이언스 분야에서는 흔히 다차원 배열을 텐서라고 합니다.

 

 

유형

설명

스칼라(scalar)

숫자 하나로 이루어진 데이터

벡터(vector)

여러 개의 숫자로 이루어진 데이터 레코드(data record)

행렬(matrix)

벡터, 즉 데이터 레코드가 여러 개 있는 데이터 집합

텐서(tensor)

같은 크기의 행렬이 여러 개 있는 것

 

 



Posted by codedragon codedragon

댓글을 달아 주세요