커널 밀도 추정(KDE; Kernel Density Estimation)

CODEDRAGON Development/Big Data, R, ...

반응형

 

커널 밀도 추정(KDE; Kernel Density Estimation)

·       커널 밀도 추정은 커널 함수라는 것을 사용합니다.

·       커널 함수(Kernel) 원점을 중심으로 대칭이며 적분값이 1 양의 함수를 의미합니다.

·       KDE 이들을 사용하여 주어진 데이터의 분포를 반영하는 새로운 분포를 만드는 것입니다.

 

https://en.wikipedia.org/wiki/Kernel_density_estimation

http://scikit-learn.org/stable/modules/density.html

 

 


 

히스토그램과 Gaussian 분포를 이용한 커널 밀도 추정


왼쪽과 같은 분포가 있다고 Gaussian 분포를 커널 함수로 사용하면 오른쪽과 같이 밀도 추정을 얻을 있습니다.

오른쪽 그래프는 왼쪽의 히스토그램을 Smoothing 하여 Continuous 그래프로 바꾸었다고 생각할 있습니다.

 

 

 

일반적으로 사용되는 커널 함수


 

https://en.wikipedia.org/wiki/Kernel_%28statistics%29

 

 

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

From Data Mining to Knowledge Discovery in Databases  (0) 2018.07.06
미세먼지 데이터 수집  (0) 2018.07.05
Azure Machine Learning 설명서  (0) 2018.07.03
Microsoft AI School  (0) 2018.07.03
데이터 - 수학 표기법  (0) 2018.07.03