Development/Python(797)
-
pd.get_dummies()
pd.get_dummies() · 원핫인코딩(one-hot encoding; 가변수)을 수행합니다. · get_dummies를 사용하면 문자열 특성만 인코딩 되며 숫자 특성은 바뀌지 않는다. · pandas의 get_dummies 함수는 숫자 특성은 모두 연속형이라고 생각해서 원핫인코딩(가변수)를 만들지 않습니다. pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) parameter description prefix 옵션을 사용하면 가변수에 공통으로 접두사를 추가할 수 있습니다. drop_first=True 가변수의 첫번째 변수를..
-
multinomial()
{SciPy}로 카테고리 분포 사용하기 · SciPy는 카테고리 분포를 위한 별도의 클래스를 제공하지 않습니다. · 다항 분포를 위한 multinomial 클래스에서 시행 횟수를 1로 설정하면 카테고리 분포가 됩니다. multinomial()
-
binom()
binom 클래스 · {Scipy} 패키지의 stats 서브 패키지에 있습니다. · 이항 분포 확률변수를 구현하고 있는 클래스입니다. binom() 인자 설명 n 전체 시도 횟수 N p 베르누이 확률 분포의 기댓값 μ
-
sns.barplot()
barplot() · 바 차트 · 카테고리 값에 따른 실수 값의 평균과 편차를 표시하는 기본적인 바 차트를 만들어줍니다. · 평균은 막대의 높이로, 편차는 에러바(error bar)로 표시합니다. 인자 설명 data 대상이 되는 데이터프레임을 지정합니다. x x 변수로 지정한 데이터프레임의 열 이름 문자열을 설정합니다. y y 변수로 지정할 데이터프레임의 열 이름 문자열을 설정합니다. hue · hue 인수에 카테고리 값을 가지는 변수의 이름을 지정하면 카테고리 값에 따라 다르게 시각화됩니다. · hue 값이 시각화되는 방법은 플롯의 종류에 따라 달라집니다. sns.barplot(x="표본값", y="비율", hue="유형", data=df) http://seaborn.pydata.org/generate..
-
확률분포 클래스 객체 생성
확률분포 클래스 객체 생성 · SciPy.stats 서브패키지의 다양한 분포메소드를 제공합니다. · 확률분포는 확률분포 클래스 객체를 생성한 후에 해당 객체의 메서드를 호출해서 사용합니다. va = scipy.stats.확률객체생성함수() · 확률객체 생성 함수는 분포의 형상을 구체적으로 지정하는 모수(parameter)를 인자로 지정할 수 있습니다. · 대부분 loc, scale 모수는 공통적으로 가지며 각각의 확률분포마다 지정해 주어야 할 모수의 종류가 다르므로 자세한 설명은 SciPy 문서를 참조하시기 바랍니다.
-
stats 서브패키지
stats 서브패키지 SciPy는 여러 개의 서브 패키지로 구성되어 있으며 stats 서브패키지는 확률분포 분석을 위한 다양한 기능을 제공합니다. stats 서브패키지 import