train_test_split()
CODEDRAGON ㆍDevelopment/Python
반응형
train_test_split()
· 데이터셋을 섞어서 나눠주는 함수입니다.
· X 데이터와 Y 데이터에서 각각 정해진 비율(%)만큼 구분하여 한 그룹은 학습에 사용하고 다른 한 그룹은 테스트 데이터를 생성해 줍니다.
· 전체 행 중 75%는 훈련 데이터로 뽑고 나머지 25%는 테스트 데이터가 됩니다.
sklearn.model_selection.
train_test_split(x, y, stratify=y, random_state=42)
|
매개변수 |
설명 |
|
x, y |
분할할 데이터 |
|
stratify=y |
그룹(binary 데이터로된 경우) |
|
random_state=42 |
랜덤상태 |
|
test_size |
테스트 셋 비율 |
학습셋을 70%, 테스트셋을 30%로 설정
|
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=seed) |
'Development > Python' 카테고리의 다른 글
| range() (0) | 2019.10.12 |
|---|---|
| SciPy 기초적인 검정 (0) | 2019.10.12 |
| 변수 생성없이 사용할 경우 (0) | 2019.10.08 |
| for문 (0) | 2019.10.07 |
| 파일 입출력 방법 (0) | 2019.10.06 |