달력

1

« 2020/1 »

  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  •  


 

 

텍스트 마이닝(Text Mining)

·       비정형 데이터 마이닝의 유형 하나입니다.

·       정형화되지 않은 문자 데이터에서 유의미한 정보를 찾아내어, 쓸모 있는 정보로 가공, 분석하는 것입니다.

·       텍스트 기반의 데이터에서 새로운 정보를 발견할 있도록 검색, 추출, 체계화, 분석하는 기술 처리 과정입니다.

·       단어의 등장 횟수 등을 평가하여 문서간의 유사성을 수치화하는 분석 방법입니다.

·       반전형 또는 비정형 텍스트에서 자연어 처리기술을 기반으로 가치있는 정보를 추출하고 가공합니다.

·       텍스트 형태로 이루어진 비정형 데이터들을 자연어 처리 방식(NLP; Natural Language Processing) 이용하여 정보 추출하는 기법입니다.

·       텍스트 마이닝(Text Mining) 활용하면 비정형화된 문서에서 정보를 얻을 있다는 장점이 있습니다. 예를 들어 텍스트 정보에서 문맥을 파악하거나 텍스트 연계를 분석할 있습니다.

 

·       텍스트 마이닝(Text Mining) 텍스트 프로세싱(Text-processing) 기술 처리 과정 포함합니다. 이는 텍스트 기반의 데이터로부터 새로운 정보를 발견할 있도록 하며, 정보 검색, 추출, 체계화, 분석 과정 모두 포함합니다.

·       텍스트 마이닝은 비정형 반정형 데이터에 대하여 자연어 처리 기술과 문서 처리 기술을 적용하여 유용한 정보를 추출, 가공하는 목적으로 하는 기술입니다.

·       실생활에서 만들어지는 대부분의 자료는 문서 형태입니다. 여러 분야의 논문, 신문 또는 잡지의 기사, 여론조사, 콜센터의 전화 보고서, 이메일, 디지털 형태의 문서 등이 문서 형태 가지고 있습니다.

·       텍스트 기반의 데이터로부터 새로운 정보를 발견할 있도록 정보 검색, 추출, 체계화, 분석을 모두 포함하는 Text-processing 기술 처리 과정입니다.

·       텍스트 내에 존재하는 단어의 등장횟수 등을 평가하여 문서간의 유사성을 수치화 하는 텍스트 데이터를 분석하는 방법입니다.

·       유사 문서 분류 및 문서 내 정보 추출과 같은 결과를 산출할 수 있습니다.

·       SNS, 게시판, 블로그, 검색 키워드등이 주로 분석 대상이 됩니다.

·       분석결과는 고객반응 수요 예측 등의 측면에서 중요한 지표가 됩니다.

 

 

 

 


Posted by codedragon codedragon

댓글을 달아 주세요