DataSet - Orange, 데이터의 기술 통계 정보 확인하기
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
Orange
· R의 내장 데이터셋 입니다.
· 오렌지 나무의 성정에 대한 데이터 셋입니다.
· 오렌지 나무의 종류, 연령, 둘레를 저장한 데이터
데이터의 기술 통계 정보 확인하기
# ----------------------------------------
# 데이터의 기술 통계 정보 확인하기
# 데이터를 불러옵니다.
> data("Orange") > data("Orange", package="datasets") |
> |
#전체 데이터의 타입 확인하기
> class(Orange) [1] "nfnGroupedData" "nfGroupedData" "groupedData" "data.frame" |
> |
# 기본으로 6개의 데이터만 출력하여 일부 데이터 확인하기(값, 컬럼 구조등)
> head(Orange) Tree age circumference 1 1 118 30 2 1 484 58 3 1 664 87 4 1 1004 115 5 1 1231 120 6 1 1372 142 |
> |
# 데이터 타입 확인
> str(Orange) Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame': 35 obs. of 3 variables: $ Tree : Ord.factor w/ 5 levels "3"<"1"<"5"<"2"<..: 2 2 2 2 2 2 2 4 4 4 ... $ age : num 118 484 664 1004 1231 ... $ circumference: num 30 58 87 115 120 142 145 33 69 111 ... - attr(*, "formula")=Class 'formula' language circumference ~ age | Tree .. ..- attr(*, ".Environment")=<environment: R_EmptyEnv> - attr(*, "labels")=List of 2 ..$ x: chr "Time since December 31, 1968" ..$ y: chr "Trunk circumference" - attr(*, "units")=List of 2 ..$ x: chr "(days)" ..$ y: chr "(mm)" |
> |
# 데이터의 컬럼 정보 확인하기
컬럼 | 설명 |
Tree | 나무 종류 |
age | 나무 나이 |
circumference | 나무 둘레 |
# 데이터에 대한 기초 통계량(요약 정보)를 확인합니다.
> summary(Orange) Tree age circumference 3:7 Min. : 118.0 Min. : 30.0 1:7 1st Qu.: 484.0 1st Qu.: 65.5 5:7 Median :1004.0 Median :115.0 2:7 Mean : 922.1 Mean :115.9 4:7 3rd Qu.:1372.0 3rd Qu.:161.5 Max. :1582.0 Max. :214.0 |
> |
# 전체 데이터
> Orange Tree age circumference 1 1 118 30 2 1 484 58 3 1 664 87 4 1 1004 115 5 1 1231 120 6 1 1372 142 7 1 1582 145 8 2 118 33 9 2 484 69 10 2 664 111 11 2 1004 156 12 2 1231 172 13 2 1372 203 14 2 1582 203 15 3 118 30 16 3 484 51 17 3 664 75 18 3 1004 108 19 3 1231 115 20 3 1372 139 21 3 1582 140 22 4 118 32 23 4 484 62 24 4 664 112 25 4 1004 167 26 4 1231 179 27 4 1372 209 28 4 1582 214 29 5 118 30 30 5 484 49 31 5 664 81 32 5 1004 125 33 5 1231 142 34 5 1372 174 35 5 1582 177 |
> |
# 해당 데이터셋의 상세 정보 확인
> help(Orange) |
> |
'Development > Big Data, R, ...' 카테고리의 다른 글
Machine learning cheat sheet - pdf (0) | 2021.11.26 |
---|---|
ERROR-‘slam’이라고 불리는 패키지가 없습니다, 패키지 ‘slam’(들)이 사용가능하지 않습니다 (0) | 2021.11.24 |
카이제곱 검정(Chi-Squared Test) (0) | 2021.09.27 |
보스턴 집값 데이터(Boston Housing Data) (0) | 2021.09.20 |
교차 엔트로피 (0) | 2021.09.13 |