3.Summary - 3. 텍스트 분류 결과 분석하기

CODEDRAGON Development/Big Data, R, ...

반응형


 

불용어 처리(Stopword Removal)

·       형태소 분석 결과로 입력된 단어들에 대하여 불용어 사전(불용어가 저장된 데이터베이스)을 참조하여 불필요한 키워드를 제거합니다. , 형태소 분석 결과를 불용어 사전에서 검색하여 일치하는 내용이 나타나면 그 내용을 삭제하여 최적의 가용어만 추출합니다.

·       일반적으로 불용어 처리를 위한  한국어 불용어 사전은 조사, 어미 등을 포함하고 있으며, 영어 불용어 사전은 관사, 전치사, be 동사 등을 포함하고 있습니다.

 

 

https://codedragon.tistory.com/7619

 

'Development > Big Data, R, ...' 카테고리의 다른 글

Quant(퀀트)  (0) 2020.01.06
summary()  (0) 2020.01.06
텍스트 분석 절차  (0) 2020.01.06
3.Summary - 3. 빅데이터 모델 평가 검증하기  (0) 2020.01.05
K-평균 클러스터링 절차  (0) 2020.01.05