resample()

CODEDRAGON Development/Python

반응형


 

 

resample()

·       groupby() 메소드를 사용해서 그룹별로 그룹 연산을 수행하여 다양한 대표값을 구할 수 있지만 시계열 데이터의 경우 {pandas} 패키지의 resample() 메소드를 이용하여 시간 단위별 시계열 데이터를 집계/요약 있습니다.

·       시간 간격을 재조정을 위한 옵션을 주어 리샘플링(resampling) 해주는 메소드입니다.

 

구분

설명

-샘플링

(up-sampling)

·       시간 구간이 작아지면 데이터 양이 증가하는 것을 말합니다.

·       -샘플링의 경우에는 실제로 존재하지 않는 데이터를 만들어야 합니다. 이 때forward filling 방식과 backward filling 방식을 사용할 수 있습니다.

 

방식

설명

forward filling 방식

·       앞에서 나온 데이터를 뒤에서 그대로 쓰는 방식

·       ffill()메서드를 이용합니다.

backward filling 방식

·       뒤에서 나올 데이터를 앞에서 미리 쓰는 방식입니다.

·       bfill() 메서드를 이용합니다.

 

다운-샘플링

(down-sampling)

·       시간 구간이 커지면 데이터 양이 감소하는 것을 말합니다.

·       원래의 데이터가 그룹으로 묶이기 때문에 groupby()와 같이 그룹 연산을 해서 대표값을 구해야 합니다.

 

 

 

http://bit.ly/3771Fdz

 

 

 

 

ataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention='start', kind=None, loffset=None, limit=None, base=0, on=None, level=None)

 

rule

시계열 데이터의 형식 지정

rule 인자를 통해 시간 단위 구간을 설정합니다.

DatetimeIndex() freq 매개변수와 동일하게 설정가능합니다.

 

closed

한계값 구간에 포함할지 여부를 지정합니다.

 

closed

설명

closed='left'

왼쪽  한계값(가장 빠른 값) 구간에 포함

closed='right'

오른쪽 한계값(가장 늦은 값) 구간에 포함

 

 

https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.DataFrame.resample.html

 

 

 

 

'5T'

5 단위 구간  

'10T'

10 단위 구간 

'20T'

20 단위 구간

'1H'

1시간 단위 구간

'1D'

1 단위 구간  

'1W'

1주일 단위 구각

'1M'

1 단위 구간  

'1Y'

1 단위 구간  

 

 

 

 



반응형

'Development > Python' 카테고리의 다른 글

read_html()  (0) 2020.02.12
ffill(), bfill()  (0) 2020.02.12
shift()  (0) 2020.02.12
date_range()  (0) 2020.02.12
to_datetime()  (0) 2020.02.12