DataSet - Orange, 데이터의 기술 통계 정보 확인하기

CODEDRAGON Development/Big Data, R, ...

반응형

 

 

 

Orange

·         R 내장 데이터셋 입니다.

·         오렌지 나무의 성정에 대한 데이터 셋입니다.

·         오렌지 나무의 종류, 연령, 둘레를 저장한 데이터

 

 

 

 

데이터의 기술 통계 정보 확인하기

# ----------------------------------------

# 데이터의 기술 통계 정보 확인하기

 

# 데이터를 불러옵니다.

> data("Orange")
> data("Orange", package="datasets")
>

 

 

#전체 데이터의 타입 확인하기

> class(Orange)
[1] "nfnGroupedData" "nfGroupedData"  "groupedData"    "data.frame"   
>

 

 

 

# 기본으로 6개의 데이터만 출력하여 일부 데이터 확인하기(, 컬럼 구조등)

> head(Orange)
  Tree  age circumference
1    1  118            30
2    1  484            58
3    1  664            87
4    1 1004           115
5    1 1231           120
6    1 1372           142
>

 

 

 

# 데이터 타입 확인

> str(Orange)
Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame':        35 obs. of  3 variables:
 $ Tree         : Ord.factor w/ 5 levels "3"<"1"<"5"<"2"<..: 2 2 2 2 2 2 2 4 4 4 ...
 $ age          : num  118 484 664 1004 1231 ...
 $ circumference: num  30 58 87 115 120 142 145 33 69 111 ...
 - attr(*, "formula")=Class 'formula'  language circumference ~ age | Tree
  .. ..- attr(*, ".Environment")=<environment: R_EmptyEnv>
 - attr(*, "labels")=List of 2
  ..$ x: chr "Time since December 31, 1968"
  ..$ y: chr "Trunk circumference"
 - attr(*, "units")=List of 2
  ..$ x: chr "(days)"
  ..$ y: chr "(mm)"
>

 

 

 

# 데이터의 컬럼 정보 확인하기

컬럼 설명
Tree 나무 종류
age 나무 나이
circumference 나무 둘레

 

 

# 데이터에 대한 기초 통계량(요약 정보) 확인합니다.

> summary(Orange)
 Tree       age         circumference 
 3:7   Min.   : 118.0   Min.   : 30.0 
 1:7   1st Qu.: 484.0   1st Qu.: 65.5 
 5:7   Median :1004.0   Median :115.0 
 2:7   Mean   : 922.1   Mean   :115.9 
 4:7   3rd Qu.:1372.0   3rd Qu.:161.5 
       Max.   :1582.0   Max.   :214.0 
>

 

 

 

 

# 전체 데이터

> Orange
   Tree  age circumference
1     1  118            30
2     1  484            58
3     1  664            87
4     1 1004           115
5     1 1231           120
6     1 1372           142
7     1 1582           145
8     2  118            33
9     2  484            69
10    2  664           111
11    2 1004           156
12    2 1231           172
13    2 1372           203
14    2 1582           203
15    3  118            30
16    3  484            51
17    3  664            75
18    3 1004           108
19    3 1231           115
20    3 1372           139
21    3 1582           140
22    4  118            32
23    4  484            62
24    4  664           112
25    4 1004           167
26    4 1231           179
27    4 1372           209
28    4 1582           214
29    5  118            30
30    5  484            49
31    5  664            81
32    5 1004           125
33    5 1231           142
34    5 1372           174
35    5 1582           177
>

 

 

 

 

# 해당 데이터셋의 상세 정보 확인

> help(Orange)
>