3.Summary - 3. 텍스트 분류 결과 분석하기
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
불용어 처리(Stopword Removal)
· 형태소 분석 결과로 입력된 단어들에 대하여 불용어 사전(불용어가 저장된 데이터베이스)을 참조하여 불필요한 키워드를 제거합니다. 즉, 형태소 분석 결과를 불용어 사전에서 검색하여 일치하는 내용이 나타나면 그 내용을 삭제하여 최적의 가용어만 추출합니다.
· 일반적으로 불용어 처리를 위한 한국어 불용어 사전은 조사, 어미 등을 포함하고 있으며, 영어 불용어 사전은 관사, 전치사, be 동사 등을 포함하고 있습니다.
https://codedragon.tistory.com/7619
'Development > Big Data, R, ...' 카테고리의 다른 글
Quant(퀀트) (0) | 2020.01.06 |
---|---|
summary() (0) | 2020.01.06 |
텍스트 분석 절차 (0) | 2020.01.06 |
3.Summary - 3. 빅데이터 모델 평가 검증하기 (0) | 2020.01.05 |
K-평균 클러스터링 절차 (0) | 2020.01.05 |