달력

7

« 2020/7 »

  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  


 

 

 

train_test_split()

·         데이터셋을 섞어서 나눠주는 함수입니다.

·         X 데이터와 Y 데이터에서 각각 정해진 비율(%)만큼 구분하여 그룹은 학습에 사용하고 다른 그룹은 테스트 데이터를 생성해 줍니다.

·         전체 75% 훈련 데이터로 뽑고 나머지 25% 테스트 데이터가 됩니다.

 

 

sklearn.model_selection.

train_test_split(x, y, stratify=y, random_state=42)

 

매개변수

설명

x, y

분할할 데이터

stratify=y

그룹(binary 데이터로된 경우)

random_state=42

랜덤상태

test_size

테스트 비율

 

http://bit.ly/2Mu5tNO

 

 

 

학습셋을 70%, 테스트셋을 30% 설정

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=seed)

 

 


'Development > Python' 카테고리의 다른 글

range()  (0) 2019.10.12
SciPy 기초적인 검정  (0) 2019.10.12
train_test_split()  (0) 2019.10.11
변수 생성없이 사용할 경우  (0) 2019.10.08
for문  (0) 2019.10.07
파일 입출력 방법  (0) 2019.10.06
Posted by codedragon codedragon

댓글을 달아 주세요