Development/Python(798)
-
resample()
resample() · groupby() 메소드를 사용해서 그룹별로 그룹 연산을 수행하여 다양한 대표값을 구할 수 있지만 시계열 데이터의 경우 {pandas} 패키지의 resample() 메소드를 이용하여 시간 단위별로 시계열 데이터를 집계/요약할 수 있습니다. · 시간 간격을 재조정을 위한 옵션을 주어 리샘플링(resampling)을 해주는 메소드입니다.
-
shift()
shift() · shift()메소드를 사용하면 인덱스는 그대로 두고 데이터만 이동할 수 있습니다. · 시계열 데이터의 인덱스는 시간이나 날짜를 나타내기 때문에 shift() 메소드를 통해 날짜 이동 연산이 가능합니다. periods 이동할 기간
-
date_range()
date_range() · 특정 범위의 타임스탬프(timestamp) 형식의 시계열 자료를 생성합니다. · 시작일과 종료일 또는 시작일과 기간을 입력하면 범위 내의 시계열 데이터를 만들어줍니다. parameter description start 시작일 end 종료일 periods 기간 freq 형식 지정 DatetimeIndex() 의 freq 매개변수와 동일 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.date_range.html
-
to_datetime()
to_datetime() · 날짜/시간을 나타내는 문자열을 자동으로 datetime 자료형으로 바꿔줍니다. · 반환 타입은 DatetimeIndex 자료형 객체로 반환됩니다. parameter description arg datetime 형식으로 변환할 데이터 http://bit.ly/379UsJX
-
DatetimeIndex()
DatetimeIndex() · DatetimeIndex() 메소드는 특정한 순간에 기록된 타임스탬프(timestamp) 형식의 시계열 자료를 다루기 위한 인덱스를 만들어줄때 사용합니다. · 타임스탬프 인덱스의 라벨값이 반드시 일정한 간격일 필요는 없습니다. parameter description dtype data type freq 특정한 날짜만 생성되도록 시계열 데이터의 형식 지정 보조함수 설명 pd.to_datetime() 날짜/시간을 나타내는 문자열을 자동으로 datetime 자료형으로 바꾼 후 DatetimeIndex 자료형 인덱스를 생성합니다. pd.date_range() 모든 날짜/시간을 일일히 입력할 필요없이 시작일과 종료일 또는 시작일과 기간을 입력하면 범위 내의 인덱스를 생성합니다.
-
시계열 데이터 다루기
시계열 데이터 다루기