createDataPartition()

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

createDataPartition()

·         {caret} 패키지의 함수입니다.

·         데이터를 훈련 데이터와 테스트 데이터로 분할하여 훈련 데이터로 사용할 데이터의 색인을 list 반환합니다.

 

createDataPartition(y, times=1, p=0.5)

y 값을 고려한 데이터의 분할을 지원합니다.

 

인자

설명

y

분류(또는 레이블)

times=1

생성할 분할의

p=0.5

훈련 데이터에서 사용할 데이터의 비율

list=TRUE

결과를 리스트로 반환할지 여부

TRUE

리스트를 반환합니다.

FALSE

행렬을 반환합니다.

 

 

 

 

 

> # 종에 관련된 데이터로 구성
> #
훈련 데이터와 테스트 데이터로 분할하여 훈련 데이터로 사용할 데이터의 색인을 list 반환
> #
비율은 p=0.7 70% 지정
> ss <- createDataPartition(iris$Species, p=0.7)

> ss
$Resample1
  [1]   1   3   4   5   6   7  10  11  12  14  15  16  17  19  20  21
 [17]  23  24  25  27  29  31  32  33  34  36  37  38  41  42  44  45
 [33]  47  49  50  51  52  53  55  57  59  61  62  63  64  65  66  68
 [49]  70  71  73  75  76  77  79  80  81  83  84  85  86  87  89  91
 [65]  92  93  94  97  98 100 102 103 104 107 108 109 110 112 114 118
 [81] 119 121 122 123 124 125 126 127 128 130 131 132 133 134 135 136
 [97] 137 138 139 140 141 144 145 146 149

>

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

확률의 조건  (0) 2019.12.27
4.Summary - 4. 자율모델 적용하기  (0) 2019.12.26
평활(smoothing)  (0) 2019.12.25
2.Summary - 2. 데이터 세트 분할하기  (0) 2019.12.25
dplyr 패키지  (0) 2019.12.24