달력

7

« 2020/7 »

  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  


 

사분위수(Quantile)

·       데이터를 가장 작은 수부터 가장 큰 수까지 크기가 커지는 순서대로 정렬하고 이를 4등분했을 각각 1/4, 2/4, 3/4, 4/4 위치에 있는 수를 지칭합니다.

·       데이터를 크기 순서로 늘어놓았을 때 25%에 해당하는 값을 제1사분위수, 50%에 해당하는 값을 중앙값(median), 75%에 해당하는 값을 제3사분위수로 표시합니다.

·       위치를 1/100 단위로 나눈 백분위수(percentile)을 사용하기도 하는데 이때 1사분위수는 25% 백분위수와 같고 2분위수는 50% 백분위수이고 3분위수는 75% 백분위수이고 최댓값은 100% 백분위수가 됩니다.

 

분위수

설명

1st Qu

·       Lower Quartile

·       1사 분위수 (25% 백분위수)

·       1/4의 위치

·       전체 데이터의 수가 만약 100개이면 처음부터 25번째에 있는

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 에 있는 값

·       하위 25%의 값을 의미 (누적 25%에 해당하는 값)

2st Qu

 

·       중앙값(median) 중위수

·       2사분위수 (50% 백분위수)

·       2/4의 위치

·       하위 50%의 값을 의미 (누적 50%에 해당하는 값)


3st Qu

·       Upper Quartile

·       3 분위수 (75% 백분위수)

·       3/4의 위치

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 에 있는 값

·       하위 75% 값을 의미 (누적 75%에 해당하는 값)

4st Qu

·       4사분위수 (100% 백분위수)

·       4/4의 위치

·       최댓값

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

한글 깨짐-인코딩 문제 발생  (0) 2020.06.08
Decision tree vs SVM  (0) 2020.05.26
사분위수(Quantile)  (2) 2020.05.17
Fβ지표  (0) 2020.05.11
팩터(factoer)  (0) 2020.05.03
Excel file sample  (0) 2020.04.26
Posted by codedragon codedragon

댓글을 달아 주세요

  1. 3월 토끼. 2020.05.14 16:52 신고  댓글주소  수정/삭제  댓글쓰기

    잘 보고 갑니다. 여쭤볼께 있는데 3st Qu의 설명중 아래에서부터 75%의 값이면 상위 25%의 값이 아닌가요?

  2. codedragon codedragon 2020.05.17 23:46 신고  댓글주소  수정/삭제  댓글쓰기

    하위 75%의 값 (누적 75%에 해당하는 값)을 의미하는 것으로
    표현을 좀 더 명확하게 수정하였습니다.

    감사합니다.