사분위수(Quantile)

CODEDRAGON Development/Big Data, R, ...

반응형


 

사분위수(Quantile)

·       데이터를 가장 작은 수부터 가장 큰 수까지 크기가 커지는 순서대로 정렬하고 이를 4등분했을 각각 1/4, 2/4, 3/4, 4/4 위치에 있는 수를 지칭합니다.

·       데이터를 크기 순서로 늘어놓았을 때 25%에 해당하는 값을 제1사분위수, 50%에 해당하는 값을 중앙값(median), 75%에 해당하는 값을 제3사분위수로 표시합니다.

·       위치를 1/100 단위로 나눈 백분위수(percentile)을 사용하기도 하는데 이때 1사분위수는 25% 백분위수와 같고 2분위수는 50% 백분위수이고 3분위수는 75% 백분위수이고 최댓값은 100% 백분위수가 됩니다.

 

분위수

설명

1st Qu

·       Lower Quartile

·       1사 분위수 (25% 백분위수)

·       1/4의 위치

·       전체 데이터의 수가 만약 100개이면 처음부터 25번째에 있는

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 에 있는 값

·       하위 25%의 값을 의미 (누적 25%에 해당하는 값)

2st Qu

 

·       중앙값(median) 중위수

·       2사분위수 (50% 백분위수)

·       2/4의 위치

·       하위 50%의 값을 의미 (누적 50%에 해당하는 값)


3st Qu

·       Upper Quartile

·       3 분위수 (75% 백분위수)

·       3/4의 위치

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 에 있는 값

·       하위 75% 값을 의미 (누적 75%에 해당하는 값)

4st Qu

·       4사분위수 (100% 백분위수)

·       4/4의 위치

·       최댓값

 

 


반응형

'Development > Big Data, R, ...' 카테고리의 다른 글

한글 깨짐-인코딩 문제 발생  (0) 2020.06.08
Decision tree vs SVM  (0) 2020.05.26
Fβ지표  (0) 2020.05.11
팩터(factoer)  (0) 2020.05.03
Excel file sample  (0) 2020.04.26