원-핫 인코딩(one-hot encoding)
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
원-핫 인코딩(one-hot encoding)
· 텍스트를 유의미한 숫자(벡터)로 바꾸는 방법입니다.
· 해당되는 하나의 데이터만 1로 변경해 주고 나머지는 0으로 채워주기 때문에 원핫 인코딩이라고 합니다.
· 단어 하나에 인덱스 정수를 할당한다는 점에서 '단어 주머니(bag of words, BoW)'라 부르기도 합니다.
· 원핫인코딩은 파이썬코드로 직접 구현할 수도 있지만 판다스나 사이킷런 패키지를 사용해서 변환할 수도 있습니다.
http://www.kakaobrain.com/blog/6
https://en.wikipedia.org/wiki/One-hot
'인간'을 표현하는 벡터 원-핫 인코딩 예
구분 |
데이터 |
인코딩 전 |
[인간, 펭귄, 문어, 사람] |
인코딩 후 인간을 표현하는 벡터 |
[1, 0, 0, 0] |
'Development > Big Data, R, ...' 카테고리의 다른 글
선형 회귀(Linear Regression) (0) | 2019.11.16 |
---|---|
나이브베이즈 특징 (0) | 2019.11.16 |
맛있는 수박/커피 고르기 (0) | 2019.11.15 |
분류 분석 모형 (0) | 2019.11.14 |
베이지안 네트워크가 활용된 사례 (0) | 2019.11.14 |