summary() 함수의 결과 해석 - 데이터

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

 

summary() 함수의 결과 - 데이터

 

> summary(do$신장.센티미터)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  153.6   170.9   174.6   174.7   178.3   198.4

>

 

> summary(iris)
  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species 
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100   setosa    :50 
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300   versicolor:50 
 Median :5.800   Median :3.000   Median :4.350   Median :1.300   virginica :50 
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199                 
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800                 
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500
                 

>

Sepal.Length 컬럼과 같이 수치형 데이터에 대해서는 최솟값Min, 1사분위수1st Qu, 중앙값Median, 평균Mean, 3사분위수3rd Qu, 최댓값Max 보여줍니다.

팩터 데이터 Species 대해서는 레벨(수준)level마다 개의 값이 있는지를 보여줍니다.

 

분위수(Quantile) 데이터를 크기 순서로 늘어놓았을 25% 해당하는 값을 1사분위수, 50% 해당하는 값을 중앙값(median), 75% 해당하는 값을 3사분위수로 표시합니다.

컬럼

설명

min

·         최솟값

1st Qu

·         Lower Quartile

·         1 분위수 (25% 분위수)

·         컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 위에 있는

·         , 하위 25% 값을 의미

Median

·         중앙값(median) 중위수 2사분위수

·         데이터를 크기대로 정렬하였을 때 가장 가운데에 있는 수

·         컬럼 데이터를 오름차순으로 정렬하여 가운데에 있는

·         데이터의 수가 짝수이면 가장 가운데에 있는 두 수의 평균을 사용합니다.

Mean

·         평균값

3st Qu

·         Upper Quartile

·         3 분위수 (75% 분위수)

·         컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 위에 있는

·         , 상위 75% 값을 의미

Max

·         최댓값

NA's

·         NA(결측치)에 대한 개수를 확인할 있습니다.

 

 

 

 

> summary(s)
    출시년도       구매시기    디스플레이.크기      연령     
 Min.   :2014   Min.   :2014   Min.   :4.50    Min.   :24.00 
 1st Qu.:2015   1st Qu.:2015   1st Qu.:5.00    1st Qu.:28.75 
 Median :2015   Median :2015   Median :5.25    Median :33.00 
 Mean   :2015   Mean   :2015   Mean   :5.25    Mean   :33.12 
 3rd Qu.:2016   3rd Qu.:2016   3rd Qu.:5.50    3rd Qu.:37.75 
 Max.   :2016   Max.   :2016   Max.   :6.00    Max.   :45.00 
                                                             
      
            몸무게      평균.스마트..사용시간
 Min.   :167.0   Min.   :59.00   Min.   : 40.00        
 1st Qu.:173.0   1st Qu.:68.75   1st Qu.: 60.00        
 Median :176.5   Median :71.00   Median : 70.00        
 Mean   :176.6   Mean   :72.62   Mean   : 79.05        
 3rd Qu.:179.5   3rd Qu.:76.75   3rd Qu.: 90.00        
 Max.   :188.0   Max.   :89.00   Max.   :180.00        
                                 NA's   :3             
 
평균.컴퓨터.사용시간 데이터.사용량  
 Min.   : 30          Min.   :  30.0 
 1st Qu.: 60          1st Qu.:  90.0 
 Median :120          Median : 160.0 
 Mean   :191          Mean   : 233.5 
 3rd Qu.:300          3rd Qu.: 300.0 
 Max.   :500          Max.   :1100.0 
 NA's   :3            NA's   :1      

>