train_test_split()
CODEDRAGON ㆍDevelopment/Python
반응형
train_test_split()
· 데이터셋을 섞어서 나눠주는 함수입니다.
· X 데이터와 Y 데이터에서 각각 정해진 비율(%)만큼 구분하여 한 그룹은 학습에 사용하고 다른 한 그룹은 테스트 데이터를 생성해 줍니다.
· 전체 행 중 75%는 훈련 데이터로 뽑고 나머지 25%는 테스트 데이터가 됩니다.
sklearn.model_selection.
train_test_split(x, y, stratify=y, random_state=42)
매개변수 |
설명 |
x, y |
분할할 데이터 |
stratify=y |
그룹(binary 데이터로된 경우) |
random_state=42 |
랜덤상태 |
test_size |
테스트 셋 비율 |
학습셋을 70%, 테스트셋을 30%로 설정
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=seed) |
'Development > Python' 카테고리의 다른 글
range() (0) | 2019.10.12 |
---|---|
SciPy 기초적인 검정 (0) | 2019.10.12 |
변수 생성없이 사용할 경우 (0) | 2019.10.08 |
for문 (0) | 2019.10.07 |
파일 입출력 방법 (0) | 2019.10.06 |