createDataPartition()

createDataPartition()

CODEDRAGON ㆍDevelopment/AI

· {caret} 패키지의 함수입니다.

· 데이터를 훈련 데이터와 테스트 데이터로 분할하여 훈련 데이터로 사용할 데이터의 색인을 list로 반환합니다.

createDataPartition(y, times=1, p=0.5)

y 값을 고려한 데이터의 분할을 지원합니다.

인자

설명

분류(또는 레이블)

times=1

생성할 분할의 수

p=0.5

훈련 데이터에서 사용할 데이터의 비율

list=TRUE

결과를 리스트로 반환할지 여부

TRUE	리스트를 반환합니다.
FALSE	행렬을 반환합니다.

> # 종에 관련된 데이터로 구성
> # 훈련 데이터와 테스트 데이터로 분할하여 훈련 데이터로 사용할 데이터의 색인을 list로 반환
> # 비율은 p=0.7로 70%로 지정
> ss <- createDataPartition(iris$Species, p=0.7)

> ss
$Resample1
[1] 1 3 4 5 6 7 10 11 12 14 15 16 17 19 20 21
[17] 23 24 25 27 29 31 32 33 34 36 37 38 41 42 44 45
[33] 47 49 50 51 52 53 55 57 59 61 62 63 64 65 66 68
[49] 70 71 73 75 76 77 79 80 81 83 84 85 86 87 89 91
[65] 92 93 94 97 98 100 102 103 104 107 108 109 110 112 114 118
[81] 119 121 122 123 124 125 126 127 128 130 131 132 133 134 135 136
[97] 137 138 139 140 141 144 145 146 149

저작자표시 비영리

'Development > AI' 카테고리의 다른 글

확률의 조건 (0)	2019.12.27
4.Summary - 4. 자율모델 적용하기 (0)	2019.12.26
평활(smoothing) (0)	2019.12.25
2.Summary - 2. 데이터 세트 분할하기 (0)	2019.12.25
dplyr 패키지 (0)	2019.12.24

CodeDragon

CodeDragon

태그

최근글

댓글

공지사항

아카이브

'Development > AI' 카테고리의 다른 글

관련글

티스토리툴바