text file, read_table()

CODEDRAGON ㆍDevelopment/Python

text file

· 형식이 없는 일반 텍스트파일은 read_table() 메소드를 통해 데이터를 구분하는 구분자(separator)를 직접 지정해 주어야 합니다.

· 텍스트 형태의 데이터 파일은 구분자로 쉼표(comma)등의 기호를 사용합니다.

· 구분자는 sep 인자를 사용하여 구분자를 지정할 수 있습니다.

· 구분자가 길이가 정해지지 않은 공백인 경우에는 \s+라는 정규식(regular expression) 문자열을 구분자로 사용합니다.

read_table()

pandas.read_table(filepath_or_buffer, sep='\t', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, skip_footer=0, doublequote=True, delim_whitespace=False, as_recarray=None, compact_ints=None, use_unsigned=None, low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)[source]

parameter	description
filepath	txt 파일 경로
sep='\s+'	구분자(separator)를 지정합니다. 정규식(regular expression) 문자열을 구분자로 사용할 수 있습니다.

http://pandas.pydata.org/pandas-docs/version/0.22/generated/pandas.read_table.html

728x90

저작자표시 비영리 (새창열림)

'Development > Python' 카테고리의 다른 글

date_range() (0)	2020.02.11
pandas 주요 메소드 (0)	2020.02.11
DataFrame.to_csv() (0)	2020.02.11
CSV - pandas (0)	2020.02.11
데이터프레임 인덱스 조작 (0)	2020.02.11

CodeDragon

CodeDragon

태그

최근글

댓글

공지사항

아카이브

read_table()

'Development > Python' 카테고리의 다른 글

관련글

티스토리툴바