CODEDRAGON ㆍDevelopment/Big Data, R, ...
카테고리 분포(Categorical distribution)
· 베르누이 분포의 확장판입니다.
· 베르누이 분포는 0 이나 1(또는 -1 이나 1)이 나오는 확률변수의 분포로 동전을 던져서 나오는 경우 동전을 던져 나오는 결과를 묘사할 때 사용할 수 있습니다.
· 동전이 아닌 주사위를 던져서 나오는 경우를 묘사할 때는 카테고리 분포를 사용할 수 있습니다. 카테고리 분포는 1부터 K까지의 K 개의 정수 값 중 하나가 나오는 확률변수의 분포입니다. 따라서 주사위를 던져 나오는 눈금의 수는 K=6 인 카테고리 분포가 됩니다.
· 카테고리 분포를 가진 확률변수는 원래 카테고리인 스칼라 값을 출력하는 확률변수지만 1과 0으로만 이루어진 다차원 벡터로 변형하여 사용합니다. 이러한 인코딩 방식을 원-핫-인코딩(One-Hot-Encoding) 이라고 합니다.
주사위의 원-핫-인코딩
경우의 수 |
One-Hot-Encoding |
x=1 |
x=(1,0,0,0,0,0) |
x=2 |
x=(0,1,0,0,0,0) |
x=3 |
x=(0,0,1,0,0,0) |
x=4 |
x=(0,0,0,1,0,0) |
x=5 |
x=(0,0,0,0,1,0) |
x=6 |
x=(0,0,0,0,0,1) |
'Development > Big Data, R, ...' 카테고리의 다른 글
다항 분포(Multinomial distribution) (0) | 2020.02.13 |
---|---|
밀도 추정(Density Estimation) (0) | 2020.02.13 |
이항 분포(二項; binomial distribution) (0) | 2020.02.13 |
베르누이 확률변수(Bernoulli random variable) (0) | 2020.02.12 |
누적분포함수 (0) | 2020.02.12 |