CODEDRAGON ㆍDevelopment/Python
기초 통계분석 함수 - R vs Python
구분 |
R 함수 |
Python
import numpy as np |
데이터 갯수 |
· # 벡터의 길이 · length(x)
|
· np.len(x) |
데이터 구조 |
· # dataframe의 행과 열의 개수 · dim(x)
· # dataframe의 행의 수 · nrow(x)
· # column(열)의 개수, 즉 변수의 개수 · ncol(x) |
· ndarray.shape |
표본 평균 |
· mean() |
· np.mean() |
표본 분산 |
· var() |
· np.var() |
표준 편차 |
· sd() |
· np.std() |
다섯 수치 요약 |
· fivenum() |
· # 최소값 · np.percentile(x, 0))
· # 1사분위 수 · np.percentile(x, 25)
· # 2사분위 수 · np.percentile(x, 50)
· # 3사분위 수 · np.percentile(x, 75)
· # 4사분위 수(최댓값) · np.percentile(x, 100) |
최빈값 |
· which.max( table() ) |
· np.argmax() |
기술 통계 |
· head() · summary() · describe{Hmisc} · summary.formula{Hmisc} |
· {SciPy} describe() |
회귀분석 |
· lm() |
· {sklearn} LogisticRegression() |
'Development > Python' 카테고리의 다른 글
Series 생성 (0) | 2020.01.28 |
---|---|
numpy 연산 (0) | 2020.01.28 |
swapaxes() (0) | 2020.01.27 |
numpy 배열의 속성 (0) | 2020.01.26 |
apply() 적용 (0) | 2020.01.25 |