Development/Python(798)
-
Pandas 시각화
Pandas 시각화· Pandas의 시리즈나 데이터프레임은 plot() 시각화 메서드를 내장하고 있습니다.· plot()은 {matplotlib}를 내부적으로 임포트하고 있어 사용방법이 비슷합니다.
-
히스토그램(histogram)
히스토그램(histogram) hist()메소드를 통해 바 플롯과 비슷한 형태의 히스토그램을 시각화합니다. hist() bins 인수로 데이터를 집계할 구간 정보를 받아서 반환값으로 데이터 집계 결과를 반환합니다.
-
라인 플롯(line plot)
라인 플롯(line plot) · 선을 그리는 가장 간단형태의 플롯입니다. · 데이터가 시간, 순서 등에 따라 어떻게 변화하는지 보여주기 위해 사용합니다. plot() · 라인 플롯(line plot)를 그려줍니다. · 플롯 명령어들을 그림을 더 잘 표현하기 위해 다양한 스타일(style)을 지원합니다. · kind 인수에 문자열을 쓰는 대신 plot.bar처럼 직접 메서드로 사용할 수도 있습니다. · 그룹 분석 결과도 데이터프레임이므로 같은 방식으로 시각화할 수 있습니다. parameter description kind 여러가지 플롯타입을 설정할 수 있습니다. bar, pie, hist, kde, box, scatter, area 중 하나를 지정합니다. https://matplotlib.org/api/..
-
titanic 데이터 셋 컬럼 정보
titanic 데이터 셋 컬럼 정보 1 Yes(생존) 0 No(사망) pclass 객차 등급 정보 Sibling brother, sister, stepbrother, stepsister Spouse husband, wife (정부와 약혼녀는 무시) parch 함께 탑승한 부모 또는 자녀의 수 C · Cherbourg · 체르부르크; 프랑스 서북부의 도시 Q · Queenstown · 퀸스타운; 뉴질랜드 남섬 오타고 지방의 내륙, 와카티푸 호수 기슭에 위치한 도시 S · Southampton · 사우샘프턴; 영국 남부 해안의 항구 도시
-
pd.get_dummies()
pd.get_dummies() · 원핫인코딩(one-hot encoding; 가변수)을 수행합니다. · get_dummies를 사용하면 문자열 특성만 인코딩 되며 숫자 특성은 바뀌지 않는다. · pandas의 get_dummies 함수는 숫자 특성은 모두 연속형이라고 생각해서 원핫인코딩(가변수)를 만들지 않습니다. pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) parameter description prefix 옵션을 사용하면 가변수에 공통으로 접두사를 추가할 수 있습니다. drop_first=True 가변수의 첫번째 변수를..
-
multinomial()
{SciPy}로 카테고리 분포 사용하기 · SciPy는 카테고리 분포를 위한 별도의 클래스를 제공하지 않습니다. · 다항 분포를 위한 multinomial 클래스에서 시행 횟수를 1로 설정하면 카테고리 분포가 됩니다. multinomial()