2020/02(330)
-
df.groupby()
df.groupby() 새 그룹을 생성합니다. 인자 설명 as_index as_index=True 기본값 as_index=False 는 생성된 그룹 정보옆에 새로운 index를 만들어 줍니다. df.groupby ("기준이 될 컬럼명") 를 통해 특정열이 아닌, df의 모든 열에 대해서 통계량을 계산할 수 있습니다. df.groupby("key1").mean() 각 key1열의 값을 가지는 행들의 갯수를 세서 산출해줍니다.
-
date_range()
date_range()모든 날짜/시간을 일일히 입력할 필요없이 시작일과 종료일 또는 시작일과 기간을 입력하면 범위 내의 인덱스를 생성할 때 사용할 수 있습니다. import pandas as pd parameter description Start 시작일 end 종료일 periods 기간 freq 특정한 날짜
-
pandas 주요 메소드
pandas 주요 메소드 import pandas as pd 값 설명 frac = 1 원본 데이터의 100%를 랜덤으로 불러옵니다. frac = 0.5 원본 데이터의 50%만 랜덤으로 불러옵니다. date_range() 모든 날짜/시간을 일일히 입력할 필요없이 시작일과 종료일 또는 시작일과 기간을 입력힌 범위의 날짜를 생성합니다.
-
text file, read_table()
text file· 형식이 없는 일반 텍스트파일은 read_table() 메소드를 통해 데이터를 구분하는 구분자(separator)를 직접 지정해 주어야 합니다.· 텍스트 형태의 데이터 파일은 구분자로 쉼표(comma)등의 기호를 사용합니다. · 구분자는 sep 인자를 사용하여 구분자를 지정할 수 있습니다.· 구분자가 길이가 정해지지 않은 공백인 경우에는 \s+라는 정규식(regular expression) 문자열을 구분자로 사용합니다. read_table() pandas.read_table(filepath_or_buffer, sep='\t', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, p..
-
DataFrame.to_csv()
DataFrame.to_csv()파이썬의 데이터프레임 값을 CSV 파일로 저장합니다. DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True, escapechar=None, decimal='.') 옵션 설명 path csv 파일명 sep..
-
머신러닝 모델의 결과 산출물 작성 및 검수
머신러닝 모델의 결과 산출물 작성 및 검수 머신러닝 데이터 분석 결과 시사점을 의사 결정자에게 보고하거나 상용 서비스에 적용하여 프로세스화 하거나 어떤 목적으로 분석을 진행하였든지 간에 분석 계획 및 과정 등 전반적인 내용에 대하여 산출물들을 체계적으로 작성하고 정리해둘 필요가 있습니다. · 주요 산출물 · 서비스 적용 구현 개발 시 추가로 필요한 산출물 머신러닝 데이터 분석 결과 주요 산출물 머신러닝 기반 데이터 분석 결과를 유관부서 이해관계자와 공유하거나 유지보수 및 모델개선 시 참고하기 위해서 핵심 결과 산출물을 계획하고 관리해야 합니다. 주요 산출물은 아래와 같은 유형이 있습니다. 물론 해당 항목들을 모두 별도의 산출물로 만들어 보관할 필요는 없으며, 분석 계획서 및 분석결과 보고서 등에 해당 내..