다섯 수치 요약(5 number summary)
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
다섯 수치 요약(5 number summary)
데이터를 최솟값, 제1사분위수, 중앙값, 제3사분위수, 최댓값으로 요약한 것을 얘기합니다.
구분 |
설명 |
min |
· 최솟값 |
1st Qu |
· Lower Quartile · 1사 분위수 (25% 분위수) · 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 위에 있는 값 · 즉, 하위 25%의 값을 의미 |
Median |
· 중앙값(median) ≒ 중위수 ≒ 2사분위수 · 데이터를 크기대로 정렬하였을 때 가장 가운데에 있는 수 · 컬럼 데이터를 오름차순으로 정렬하여 가운데에 있는 값 · 데이터의 수가 짝수이면 가장 가운데에 있는 두 수의 평균을 사용합니다. |
Mean |
· 평균값 |
3st Qu |
· Upper Quartile · 3사 분위수 (75% 분위수) · 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 위에 있는 값 · 즉, 상위 75%의 값을 의미 |
Max |
· 최댓값 |
'Development > Big Data, R, ...' 카테고리의 다른 글
상자 그림(boxplot), 상자 그림(boxplot) 해석방법 (3) | 2018.06.20 |
---|---|
googleVis 패키지 설치하기, googleVis 패키지 임포트 (0) | 2018.06.17 |
평균(mean; average) (0) | 2018.06.15 |
rvest 패키지 설치하기, rvest 패키지 임포트 (0) | 2018.06.14 |
Download the Developer’s Guide to Building AI Applications - free e-book (0) | 2018.06.13 |