CODEDRAGON ㆍDevelopment/Big Data, R, ...
R 코드 예시 - 데이터 분할
{caret} Package로 createDataPartition()함수를 사용하여 iris data를 Species 기준으로 70%는 훈련용 데이터로 나머지 30%는 검증용 데이터로 데이터셋을 분할하고 검증하는 R Code 예시입니다.
>
library(caret)
# iris
data를
Species 기준으로
70%는 훈련용 데이터로 > train.idx<-createDataPartition(iris$Species, p=0.7, list=F)
# 데이터의 색인list
확인
#
train.idx를 통해 훈련데이터 생성 # 훈련데이터 확인 #
iris_train를 제외한 데이터로 테스트데이터 생성
# 테스트 데이터 확인 # dim():
• 차원(dimension) 지정함수
# 45 x 5 차원의 행렬을 생성합니다. |
> |
https://codedragon.tistory.com/9580
https://codedragon.tistory.com/4970
https://codedragon.tistory.com/6783
https://codedragon.tistory.com/9933
https://codedragon.tistory.com/9493
'Development > Big Data, R, ...' 카테고리의 다른 글
데이터 분석 기법 선정 (0) | 2020.01.15 |
---|---|
공분산 값 의미 (0) | 2020.01.15 |
3.Summary - 3.데이터 검증하기 (0) | 2020.01.14 |
LOOCV(Leave-One-Out-Cross-Validation) (0) | 2020.01.14 |
모델이 복잡한 경우 (0) | 2020.01.14 |