CODEDRAGON ㆍDevelopment/Python
resample()
· groupby() 메소드를 사용해서 그룹별로 그룹 연산을 수행하여 다양한 대표값을 구할 수 있지만 시계열 데이터의 경우 {pandas} 패키지의 resample() 메소드를 이용하여 시간 단위별로 시계열 데이터를 집계/요약할 수 있습니다.
· 시간 간격을 재조정을 위한 옵션을 주어 리샘플링(resampling)을 해주는 메소드입니다.
구분 |
설명 |
||||||
업-샘플링 (up-sampling) |
· 시간 구간이 작아지면↓ 데이터 양이 증가↑하는 것을 말합니다. · 업-샘플링의 경우에는 실제로 존재하지 않는 데이터를 만들어야 합니다. 이 때forward filling 방식과 backward filling 방식을 사용할 수 있습니다.
|
||||||
다운-샘플링 (down-sampling) |
· 시간 구간이 커지면↑ 데이터 양이 감소↓하는 것을 말합니다. · 원래의 데이터가 그룹으로 묶이기 때문에 groupby()와 같이 그룹 연산을 해서 대표값을 구해야 합니다.
|
ataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention='start', kind=None, loffset=None, limit=None, base=0, on=None, level=None) |
rule |
시계열 데이터의 형식 지정 rule 인자를 통해 시간 단위 구간을 설정합니다. DatetimeIndex() 의 freq 매개변수와 동일하게 설정가능합니다.
|
||||||
closed |
한계값을 구간에 포함할지 여부를 지정합니다.
|
https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.DataFrame.resample.html
'5T' |
5분 단위 구간 |
'10T' |
10분 단위 구간 |
'20T' |
20분 단위 구간 |
'1H' |
1시간 단위 구간 |
'1D' |
1일 단위 구간 |
'1W' |
1주일 단위 구각 |
'1M' |
1달 단위 구간 |
'1Y' |
1년 단위 구간 |
'Development > Python' 카테고리의 다른 글
read_html() (0) | 2020.02.12 |
---|---|
ffill(), bfill() (0) | 2020.02.12 |
shift() (0) | 2020.02.12 |
date_range() (0) | 2020.02.12 |
to_datetime() (0) | 2020.02.12 |