달력

12

« 2019/12 »

  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  
  •  
  •  
  •  



 

 

텍스트 마이닝의 문제점(한계)

텍스트 마이닝의 문제점은 크게 가지가 있습니다.

 

문제점

설명

자연어에 영향을 많이 받는다

·         자연어란 사람이 쓰는 말로 한국어, 일본어, 독일어, 영어 등을 의미합니다.

·         자연어 한글이나 한국어 처리에서 문제가 있는 분야는 광학문자판독(OCR, Optical Character Recognition), 음성인식(Speech Recognition) 그리고 감성분석(Sentimental Analysis) 등이 있습니다.

분석 결과물 자체로 어떤 성과를 보기 어렵다

·         분석 결과물 자체를 그대로 비즈니스 모델에 적용해서 뭔가를 만들어 성과를 보기 어렵다는 의미입니다.

·         워드 클라우드는 자주 있는 분석 결과물 시각화 방법으로 단어들이 둥둥 있고 단어끼리 선을 연결하여 시각화하는 방법입니다.

 

 


Posted by codedragon codedragon

댓글을 달아 주세요