전체 글(14828)
-
라인 플롯(line plot)
라인 플롯(line plot) · 선을 그리는 가장 간단형태의 플롯입니다. · 데이터가 시간, 순서 등에 따라 어떻게 변화하는지 보여주기 위해 사용합니다. plot() · 라인 플롯(line plot)를 그려줍니다. · 플롯 명령어들을 그림을 더 잘 표현하기 위해 다양한 스타일(style)을 지원합니다. · kind 인수에 문자열을 쓰는 대신 plot.bar처럼 직접 메서드로 사용할 수도 있습니다. · 그룹 분석 결과도 데이터프레임이므로 같은 방식으로 시각화할 수 있습니다. parameter description kind 여러가지 플롯타입을 설정할 수 있습니다. bar, pie, hist, kde, box, scatter, area 중 하나를 지정합니다. https://matplotlib.org/api/..
-
밀도 추정(Density Estimation)
밀도 추정(Density Estimation) · 통계학에서 다루는 용어로 데이터와 변수의 관계를 파악하는 방법입니다. · 데이터로 부터 변수가 가질 수 있는 모든 값의 밀도(확률)을 추정하는 것입니다. https://en.wikipedia.org/wiki/Density_estimation
-
titanic 데이터 셋 컬럼 정보
titanic 데이터 셋 컬럼 정보 1 Yes(생존) 0 No(사망) pclass 객차 등급 정보 Sibling brother, sister, stepbrother, stepsister Spouse husband, wife (정부와 약혼녀는 무시) parch 함께 탑승한 부모 또는 자녀의 수 C · Cherbourg · 체르부르크; 프랑스 서북부의 도시 Q · Queenstown · 퀸스타운; 뉴질랜드 남섬 오타고 지방의 내륙, 와카티푸 호수 기슭에 위치한 도시 S · Southampton · 사우샘프턴; 영국 남부 해안의 항구 도시
-
pd.get_dummies()
pd.get_dummies() · 원핫인코딩(one-hot encoding; 가변수)을 수행합니다. · get_dummies를 사용하면 문자열 특성만 인코딩 되며 숫자 특성은 바뀌지 않는다. · pandas의 get_dummies 함수는 숫자 특성은 모두 연속형이라고 생각해서 원핫인코딩(가변수)를 만들지 않습니다. pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) parameter description prefix 옵션을 사용하면 가변수에 공통으로 접두사를 추가할 수 있습니다. drop_first=True 가변수의 첫번째 변수를..
-
multinomial()
{SciPy}로 카테고리 분포 사용하기 · SciPy는 카테고리 분포를 위한 별도의 클래스를 제공하지 않습니다. · 다항 분포를 위한 multinomial 클래스에서 시행 횟수를 1로 설정하면 카테고리 분포가 됩니다. multinomial()
-
카테고리 분포(Categorical distribution)
카테고리 분포(Categorical distribution) · 베르누이 분포의 확장판입니다. · 베르누이 분포는 0 이나 1(또는 -1 이나 1)이 나오는 확률변수의 분포로 동전을 던져서 나오는 경우 동전을 던져 나오는 결과를 묘사할 때 사용할 수 있습니다. · 동전이 아닌 주사위를 던져서 나오는 경우를 묘사할 때는 카테고리 분포를 사용할 수 있습니다. 카테고리 분포는 1부터 K까지의 K 개의 정수 값 중 하나가 나오는 확률변수의 분포입니다. 따라서 주사위를 던져 나오는 눈금의 수는 K=6 인 카테고리 분포가 됩니다. · 카테고리 분포를 가진 확률변수는 원래 카테고리인 스칼라 값을 출력하는 확률변수지만 1과 0으로만 이루어진 다차원 벡터로 변형하여 사용합니다. 이러한 인코딩 방식을 원-핫-인코딩(One..