summary() 함수의 결과 해석

summary() 함수의 결과 해석 - 데이터

CODEDRAGON ㆍDevelopment/AI

summary() 함수의 결과 - 데이터

> summary(do$신장.센티미터)
Min. 1st Qu. Median Mean 3rd Qu. Max.
153.6 170.9 174.6 174.7 178.3 198.4

> summary(iris)
Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species
Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100   setosa    :50
1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300   versicolor:50
Median :5.800   Median :3.000   Median :4.350   Median :1.300   virginica :50
Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199
3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800
Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500

Sepal.Length 컬럼과 같이 수치형 데이터에 대해서는 최솟값Min, 1사분위수1st Qu, 중앙값Median, 평균Mean, 3사분위수3rd Qu, 최댓값Max을 보여줍니다.

팩터 데이터 Species에 대해서는 각 레벨(수준)level마다 몇 개의 값이 있는지를 보여줍니다.

분위수(Quantile)는 데이터를 크기 순서로 늘어놓았을 때 25%에 해당하는 값을 제1사분위수, 50%에 해당하는 값을 중앙값(median), 75%에 해당하는 값을 제3사분위수로 표시합니다.

컬럼	설명
min	· 최솟값
1st Qu	· Lower Quartile · 1사 분위수 (25% 분위수) · 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 위에 있는 값 · 즉, 하위 25%의 값을 의미
Median	· 중앙값(median) ≒ 중위수 ≒ 2사분위수 · 데이터를 크기대로 정렬하였을 때 가장 가운데에 있는 수 · 컬럼 데이터를 오름차순으로 정렬하여 가운데에 있는 값 · 데이터의 수가 짝수이면 가장 가운데에 있는 두 수의 평균을 사용합니다.
Mean	· 평균값
3st Qu	· Upper Quartile · 3사 분위수 (75% 분위수) · 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 위에 있는 값 · 즉, 상위 75%의 값을 의미
Max	· 최댓값
NA's	· NA(결측치)에 대한 개수를 확인할 수 있습니다.

> summary(s)
    출시년도       구매시기    디스플레이.크기      연령
Min.   :2014   Min.   :2014   Min.   :4.50    Min.   :24.00
1st Qu.:2015   1st Qu.:2015   1st Qu.:5.00    1st Qu.:28.75
Median :2015   Median :2015   Median :5.25    Median :33.00
Mean   :2015   Mean   :2015   Mean   :5.25    Mean   :33.12
3rd Qu.:2016   3rd Qu.:2016   3rd Qu.:5.50    3rd Qu.:37.75
Max.   :2016   Max.   :2016   Max.   :6.00    Max.   :45.00

       키            몸무게      평균.스마트.폰.사용시간
Min.   :167.0   Min.   :59.00   Min.   : 40.00
1st Qu.:173.0   1st Qu.:68.75   1st Qu.: 60.00
Median :176.5   Median :71.00   Median : 70.00
Mean   :176.6   Mean   :72.62   Mean   : 79.05
3rd Qu.:179.5   3rd Qu.:76.75   3rd Qu.: 90.00
Max.   :188.0   Max.   :89.00   Max.   :180.00
                                 NA's   :3
평균.컴퓨터.사용시간 데이터.사용량
Min.   : 30          Min.   : 30.0
1st Qu.: 60          1st Qu.: 90.0
Median :120          Median : 160.0
Mean   :191          Mean   : 233.5
3rd Qu.:300          3rd Qu.: 300.0
Max.   :500          Max.   :1100.0
NA's   :3            NA's   :1

728x90

저작자표시 비영리 (새창열림)

'Development > AI' 카테고리의 다른 글

가설 검정의 오류 (0)	2020.02.07
유의수준(significance level; α), 귀무가설(H0)과 대립가설(H1)의 채택 (0)	2020.02.07
강화 학습(RL; Reinforcement Learning) (0)	2020.02.06
재현율(Recall) & 정밀도(Precision) 예시 (0)	2020.02.06
집합(set) (0)	2020.02.04

CodeDragon

CodeDragon

태그

최근글

댓글

공지사항

아카이브

'Development > AI' 카테고리의 다른 글

관련글

티스토리툴바