CODEDRAGON ㆍDevelopment/Python
CSV 파일 읽기
· CSV 파일을 읽기 위해서는 먼저 파이썬에 기본 내장된 {csv} 모듈을 import 해야 합니다.
· import 후 .csv 파일을 오픈하여 파일객체를 생성하고 파일객체를 csv.reader(파일객체) 에 넣으면 파일 내용을 읽어올 수 있습니다.
csv.reader()
· csv.reader() 함수는 Iterator 타입인 reader 객체를 리턴합니다.
· Iterator 타입인 reader 객체를 리턴되므로 for 루프를 돌며 한 라인씩 가져올 수 있습니다. 이때 리턴되는 각 라인은 컬럼들을 나열한 리스트(list) 입니다.
csv.reader(fileobject, 'r', delimiter='\t' , encoding='cp949') |
인자 |
설명 |
||||
fileobject |
csv 파일 객체 |
||||
'r' |
모드
|
||||
delimiter |
구분자 |
||||
encoding |
인코딩 방식 생략하면 시스템의 기본 인코딩 방식이 적용됩니다. encoding='cp949' |
||||
quotechar |
따옴표 문자(필드 안의 데이터를 묶는다)를 지정 |
||||
skipinitialspace=True |
필드 앞의 공백은 제거 skipinitialspace=True 파라미터를 입력받지 않는 한 필드 앞의 공백은 제거하지 않습니다. |
read.csv()
read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, comment.char = "", ...)
|
매개변수 |
설명 |
||||
file |
· 읽어올 csv 파일 |
||||
header |
· 열의 이름 · 기본값은 TRUE · csv파일에 열의 이름이 있을 경우에는 T를 열의 이름이 없이 1행부터 데이터가 들어있는 경우에는F로 설정합니다.
|
||||
sep |
· 열을 구분하는 기호 · 기본값은 콤마(,) |
||||
quote |
· 각 열을 감싸는 문자 지정. · 기본값은 큰따옴표(") · 감싸는 문자 안에 있는 열 구분기호는 읽어들일 자료로 인식합니다. |
||||
dec |
· 소수점을 나타내는 기호 · 기본값은 점(.) |
||||
fill |
· 기본값은 TRUE · 행 별로 열의 길이가 다를 때는 FALSE를 사용합니다.
|
||||
comment.char |
· 주석을 나타내는 기호를 지정합니다. · 기본값은 빈문자열("") · comment.char=""로 설정값이 빈문자열인 경우 주석 읽는 것을 하지 않습니다. |
||||
… |
· read.table()과 동일한 매개변수 정보를 read.csv()에도 사용할 수 있습니다. |
'Development > Python' 카테고리의 다른 글
next() (0) | 2020.02.27 |
---|---|
isinstance(인스턴스 객체, 클래스 객체) (0) | 2020.02.26 |
CSV 다루기 (0) | 2020.02.26 |
zipfile 모듈 (0) | 2020.02.26 |
os 내장 모듈 (0) | 2020.02.26 |