train_test_split()

CODEDRAGON Development/Python

반응형


 

 

 

train_test_split()

·         데이터셋을 섞어서 나눠주는 함수입니다.

·         X 데이터와 Y 데이터에서 각각 정해진 비율(%)만큼 구분하여 그룹은 학습에 사용하고 다른 그룹은 테스트 데이터를 생성해 줍니다.

·         전체 75% 훈련 데이터로 뽑고 나머지 25% 테스트 데이터가 됩니다.

 

 

sklearn.model_selection.

train_test_split(x, y, stratify=y, random_state=42)

 

매개변수

설명

x, y

분할할 데이터

stratify=y

그룹(binary 데이터로된 경우)

random_state=42

랜덤상태

test_size

테스트 비율

 

http://bit.ly/2Mu5tNO

 

 

 

학습셋을 70%, 테스트셋을 30% 설정

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=seed)

 

 


'Development > Python' 카테고리의 다른 글

range()  (0) 2019.10.12
SciPy 기초적인 검정  (0) 2019.10.12
변수 생성없이 사용할 경우  (0) 2019.10.08
for문  (0) 2019.10.07
파일 입출력 방법  (0) 2019.10.06