2020/02(330)
-
titanic 데이터 셋 컬럼 정보
titanic 데이터 셋 컬럼 정보 1 Yes(생존) 0 No(사망) pclass 객차 등급 정보 Sibling brother, sister, stepbrother, stepsister Spouse husband, wife (정부와 약혼녀는 무시) parch 함께 탑승한 부모 또는 자녀의 수 C · Cherbourg · 체르부르크; 프랑스 서북부의 도시 Q · Queenstown · 퀸스타운; 뉴질랜드 남섬 오타고 지방의 내륙, 와카티푸 호수 기슭에 위치한 도시 S · Southampton · 사우샘프턴; 영국 남부 해안의 항구 도시
-
pd.get_dummies()
pd.get_dummies() · 원핫인코딩(one-hot encoding; 가변수)을 수행합니다. · get_dummies를 사용하면 문자열 특성만 인코딩 되며 숫자 특성은 바뀌지 않는다. · pandas의 get_dummies 함수는 숫자 특성은 모두 연속형이라고 생각해서 원핫인코딩(가변수)를 만들지 않습니다. pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) parameter description prefix 옵션을 사용하면 가변수에 공통으로 접두사를 추가할 수 있습니다. drop_first=True 가변수의 첫번째 변수를..
-
multinomial()
{SciPy}로 카테고리 분포 사용하기 · SciPy는 카테고리 분포를 위한 별도의 클래스를 제공하지 않습니다. · 다항 분포를 위한 multinomial 클래스에서 시행 횟수를 1로 설정하면 카테고리 분포가 됩니다. multinomial()
-
카테고리 분포(Categorical distribution)
카테고리 분포(Categorical distribution) · 베르누이 분포의 확장판입니다. · 베르누이 분포는 0 이나 1(또는 -1 이나 1)이 나오는 확률변수의 분포로 동전을 던져서 나오는 경우 동전을 던져 나오는 결과를 묘사할 때 사용할 수 있습니다. · 동전이 아닌 주사위를 던져서 나오는 경우를 묘사할 때는 카테고리 분포를 사용할 수 있습니다. 카테고리 분포는 1부터 K까지의 K 개의 정수 값 중 하나가 나오는 확률변수의 분포입니다. 따라서 주사위를 던져 나오는 눈금의 수는 K=6 인 카테고리 분포가 됩니다. · 카테고리 분포를 가진 확률변수는 원래 카테고리인 스칼라 값을 출력하는 확률변수지만 1과 0으로만 이루어진 다차원 벡터로 변형하여 사용합니다. 이러한 인코딩 방식을 원-핫-인코딩(One..
-
binom()
binom 클래스 · {Scipy} 패키지의 stats 서브 패키지에 있습니다. · 이항 분포 확률변수를 구현하고 있는 클래스입니다. binom() 인자 설명 n 전체 시도 횟수 N p 베르누이 확률 분포의 기댓값 μ
-
이항 분포(二項; binomial distribution)
이항 분포(二項; binomial distribution) · 이항 확률 분포 · n번의 독립적 시행에서 각 시행이 확률 p를 가질 때 시행을 몇 번 성공했는지를 표현하는 이산확률분포 이항 분포의 확률 함수는 아래와 같이 표현됩니다.