원-핫 인코딩(one-hot encoding)

CODEDRAGON Development/Big Data, R, ...

반응형


 

 

- 인코딩(one-hot encoding)

·         텍스트를 유의미한 숫자(벡터) 바꾸는 방법입니다.

·         해당되는 하나의 데이터만 1 변경해 주고 나머지는 0으로 채워주기 때문에 원핫 인코딩이라고 합니다.


·         단어 하나에 인덱스 정수를 할당한다는 점에서 '단어 주머니(bag of words, BoW)' 부르기도 합니다.

·         원핫인코딩은 파이썬코드로 직접 구현할 수도 있지만 판다스나 사이킷런 패키지를 사용해서 변환할 수도 있습니다.

 

 

 

 

http://www.kakaobrain.com/blog/6

https://en.wikipedia.org/wiki/One-hot

 

 

 

 

 

'인간'을 표현하는 벡터 원-핫 인코딩 예

 

구분

데이터

인코딩

[인간, 펭귄, 문어, 사람]

인코딩

인간을 표현하는 벡터

[1, 0, 0, 0]

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

선형 회귀(Linear Regression)  (0) 2019.11.16
나이브베이즈 특징  (0) 2019.11.16
맛있는 수박/커피 고르기  (0) 2019.11.15
분류 분석 모형  (0) 2019.11.14
베이지안 네트워크가 활용된 사례  (0) 2019.11.14