CODEDRAGON ㆍDevelopment/AI
사분위수(Quantile)
· 데이터를 가장 작은 수부터 가장 큰 수까지 크기가 커지는 순서대로 정렬하고 이를 4등분했을 때 각각 1/4, 2/4, 3/4, 4/4 위치에 있는 수를 지칭합니다.
· 데이터를 크기 순서로 늘어놓았을 때 25%에 해당하는 값을 제1사분위수, 50%에 해당하는 값을 중앙값(median), 75%에 해당하는 값을 제3사분위수로 표시합니다.
· 위치를 1/100 단위로 나눈 백분위수(percentile)을 사용하기도 하는데 이때 1사분위수는 25% 백분위수와 같고 2분위수는 50% 백분위수이고 3분위수는 75% 백분위수이고 최댓값은 100% 백분위수가 됩니다.
분위수 |
설명 |
1st Qu |
· Lower Quartile · 1사 분위수 (25% 백분위수) · 1/4의 위치 · 전체 데이터의 수가 만약 100개이면 처음부터 25번째에 있는 값 · 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 에 있는 값 · 하위 25%의 값을 의미 (누적 25%에 해당하는 값) |
2st Qu
|
· 중앙값(median) ≒ 중위수 · 2사분위수 (50% 백분위수) · 2/4의 위치 · 하위 50%의 값을 의미 (누적 50%에 해당하는 값) |
3st Qu |
· Upper Quartile · 3사 분위수 (75% 백분위수) · 3/4의 위치 · 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 에 있는 값 · 하위 75%의 값을 의미 (누적 75%에 해당하는 값) |
4st Qu |
· 4사분위수 (100% 백분위수) · 4/4의 위치 · 최댓값 |
'Development > AI' 카테고리의 다른 글
한글 깨짐-인코딩 문제 발생 (0) | 2020.06.08 |
---|---|
Decision tree vs SVM (0) | 2020.05.26 |
Fβ지표 (0) | 2020.05.11 |
팩터(factoer) (0) | 2020.05.03 |
Excel file sample (0) | 2020.04.26 |