2020/02(330)
-
read_html()
read_html() 웹 페이지에서 테이블 형태의 데이터를 추출하는 함수입니다 import pandas as pd df = pd.read_html()
-
ffill(), bfill()
ffill() · forward filling 방식 · 앞에서 나온 데이터를 뒤에서 그대로 쓰는 방식으로 샘플링을 수행합니다. bfill() · backward filling 방식 · 뒤에서 나올 데이터를 앞에서 미리 쓰는 방식으로 샘플링을 수행합니다
-
resample()
resample() · groupby() 메소드를 사용해서 그룹별로 그룹 연산을 수행하여 다양한 대표값을 구할 수 있지만 시계열 데이터의 경우 {pandas} 패키지의 resample() 메소드를 이용하여 시간 단위별로 시계열 데이터를 집계/요약할 수 있습니다. · 시간 간격을 재조정을 위한 옵션을 주어 리샘플링(resampling)을 해주는 메소드입니다.
-
shift()
shift() · shift()메소드를 사용하면 인덱스는 그대로 두고 데이터만 이동할 수 있습니다. · 시계열 데이터의 인덱스는 시간이나 날짜를 나타내기 때문에 shift() 메소드를 통해 날짜 이동 연산이 가능합니다. periods 이동할 기간
-
date_range()
date_range() · 특정 범위의 타임스탬프(timestamp) 형식의 시계열 자료를 생성합니다. · 시작일과 종료일 또는 시작일과 기간을 입력하면 범위 내의 시계열 데이터를 만들어줍니다. parameter description start 시작일 end 종료일 periods 기간 freq 형식 지정 DatetimeIndex() 의 freq 매개변수와 동일 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.date_range.html
-
to_datetime()
to_datetime() · 날짜/시간을 나타내는 문자열을 자동으로 datetime 자료형으로 바꿔줍니다. · 반환 타입은 DatetimeIndex 자료형 객체로 반환됩니다. parameter description arg datetime 형식으로 변환할 데이터 http://bit.ly/379UsJX