Development(7985)
-
확률 밀도 함수(Probability density function)
확률 밀도 함수(Probability density function)· 확률밀도를 함수형태로 나타낸 것입니다.· 확률 밀도 함수는 연속형 데이터의 확률을 표현합니다. 강수량, 키, 몸무게 등의 값이 연속형 데이터에 해당됩니다.· 확률 밀도 함수는 f(x)처럼 소문자 f로 표시합니다.
-
pivot()
pivot() · 피봇 테이블을 만들어 줍니다. · 지정된 두 열을 각각 행 인덱스와 열 인덱스로 바꾼 후 행 인덱스의 라벨 값이 첫번째 키의 값과 같고 열 인덱스의 라벨 값이 두번째 키의 값과 같은 데이터를 찾아서 해당 칸에 넣습니다. · 만약 주어진 데이터가 존재하지 않으면 해당 칸에 NaN 값으로 표시됩니다. · 행 인덱스와 열 인덱스는 하나의 데이터를 찾는 키(key)의 역할을 합니다. 즉, 이 값으로 데이터가 유일하게(unique) 결정되어야 합니다. 만약 행 인덱스와 열 인덱스 조건을 만족하는 데이터가 2개 이상인 경우에는 에러가 발생합니다. parameter description index 행 인덱스로 사용할 열 이름 columns 열 인덱스로 사용할 열 이름 values 데이터로 사용할 열..
-
read_html()
read_html() 웹 페이지에서 테이블 형태의 데이터를 추출하는 함수입니다 import pandas as pd df = pd.read_html()
-
ffill(), bfill()
ffill() · forward filling 방식 · 앞에서 나온 데이터를 뒤에서 그대로 쓰는 방식으로 샘플링을 수행합니다. bfill() · backward filling 방식 · 뒤에서 나올 데이터를 앞에서 미리 쓰는 방식으로 샘플링을 수행합니다
-
resample()
resample() · groupby() 메소드를 사용해서 그룹별로 그룹 연산을 수행하여 다양한 대표값을 구할 수 있지만 시계열 데이터의 경우 {pandas} 패키지의 resample() 메소드를 이용하여 시간 단위별로 시계열 데이터를 집계/요약할 수 있습니다. · 시간 간격을 재조정을 위한 옵션을 주어 리샘플링(resampling)을 해주는 메소드입니다.
-
shift()
shift() · shift()메소드를 사용하면 인덱스는 그대로 두고 데이터만 이동할 수 있습니다. · 시계열 데이터의 인덱스는 시간이나 날짜를 나타내기 때문에 shift() 메소드를 통해 날짜 이동 연산이 가능합니다. periods 이동할 기간