기초 통계분석 함수 - R vs Python

CODEDRAGON Development/Python

반응형


 

기초 통계분석 함수 - R vs Python

 

구분

R 함수

Python

 

import numpy as np

데이터 갯수

·       # 벡터의 길이

·       length(x)

 

 

·       np.len(x)

데이터 구조

·       # dataframe의 행과 열의 개수

·       dim(x)

 

 

·       # dataframe의 행의 수

·       nrow(x)

 

·       # column()의 개수, 즉 변수의 개수

·       ncol(x)

·       ndarray.shape

표본 평균

·       mean()

·       np.mean()

표본 분산

·       var()

·       np.var()

표준 편차

·       sd()

·       np.std()

다섯 수치 요약

·       fivenum()

·       # 최소값

·       np.percentile(x, 0))

 

·       # 1사분위

·       np.percentile(x, 25)

 

·       # 2사분위

·       np.percentile(x, 50)

 

·       # 3사분위

·       np.percentile(x, 75)

 

·       # 4사분위 (최댓값)

·       np.percentile(x, 100)

최빈값

·       which.max( table() )

·       np.argmax()

기술 통계

·       head()

·       summary()

·       describe{Hmisc}

·       summary.formula{Hmisc}

·       {SciPy} describe()

회귀분석

·       lm()

·       {sklearn} LogisticRegression()

 

 

반응형

'Development > Python' 카테고리의 다른 글

Series 생성  (0) 2020.01.28
numpy 연산  (0) 2020.01.28
swapaxes()  (0) 2020.01.27
numpy 배열의 속성  (0) 2020.01.26
apply() 적용  (0) 2020.01.25