다섯 수치 요약(5 number summary)

CODEDRAGON Development/Big Data, R, ...

반응형


 

다섯 수치 요약(5 number summary)

데이터를 최솟값, 1사분위수, 중앙값, 3사분위수, 최댓값으로 요약한 것을 얘기합니다.

 

구분

설명

min

·       최솟값

1st Qu

·       Lower Quartile

·       1 분위수 (25% 분위수)

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 위에 있는

·       , 하위 25% 값을 의미

Median

·       중앙값(median) 중위수 2사분위수

·       데이터를 크기대로 정렬하였을 가장 가운데에 있는

·       컬럼 데이터를 오름차순으로 정렬하여 가운데에 있는

·       데이터의 수가 짝수이면 가장 가운데에 있는 수의 평균을 사용합니다.

Mean

·       평균값

3st Qu

·       Upper Quartile

·       3 분위수 (75% 분위수)

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 위에 있는

·       , 상위 75% 값을 의미

Max

·       최댓값