말뭉치(Corpus)

CODEDRAGON Development/Big Data, R, ...

반응형




 

 

말뭉치(Corpus)

·         코퍼스

·         정형이나 비정형인 단어나 표현의 묶음입니다.

·         자연어 분석 작업을 위해 만든 샘플 문서 집합을 지칭합니다.

·         소설, 신문 등의 문서를 단순히 모아놓은 것도 있지만 품사, 형태소, 등의 보조적 의미를 추가하고 쉬운 분석을 위해 구조적인 형태로 정리해 놓은 것도 포함됩니다.

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

6.Summary - 6. 학습결과 적용하기  (0) 2020.01.27
텍스트 데이터 전처리  (0) 2020.01.26
신뢰도(conviction)  (0) 2020.01.24
Moravec's Paradox (모라벡의 역설)  (0) 2020.01.23
과소적합(underfitting)  (0) 2020.01.23