CODEDRAGON ㆍDevelopment/Big Data, R, ...
커널 밀도 추정(KDE; Kernel Density Estimation)
· 커널 밀도 추정은 커널 함수라는 것을 사용합니다.
· 커널 함수(Kernel)는 원점을 중심으로 대칭이며 적분값이 1 인 양의 함수를 의미합니다.
· KDE는 이들을 사용하여 주어진 데이터의 분포를 반영하는 새로운 분포를 만드는 것입니다.
https://en.wikipedia.org/wiki/Kernel_density_estimation
http://scikit-learn.org/stable/modules/density.html
히스토그램과 Gaussian 분포를 이용한 커널 밀도 추정
왼쪽과 같은 분포가 있다고 할 때 Gaussian 분포를 커널 함수로 사용하면 오른쪽과 같이 밀도 추정을 얻을 수 있습니다.
오른쪽 그래프는 왼쪽의 히스토그램을 Smoothing 하여 Continuous한 그래프로 바꾸었다고 생각할 수 있습니다.
일반적으로 사용되는 커널 함수
https://en.wikipedia.org/wiki/Kernel_%28statistics%29
'Development > Big Data, R, ...' 카테고리의 다른 글
From Data Mining to Knowledge Discovery in Databases (0) | 2018.07.06 |
---|---|
미세먼지 데이터 수집 (0) | 2018.07.05 |
Azure Machine Learning 설명서 (0) | 2018.07.03 |
Microsoft AI School (0) | 2018.07.03 |
데이터 - 수학 표기법 (0) | 2018.07.03 |