말뭉치(Corpus)
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
말뭉치(Corpus)
· ≒ 코퍼스
· 정형이나 비정형인 단어나 표현의 묶음입니다.
· 자연어 분석 작업을 위해 만든 샘플 문서 집합을 지칭합니다.
· 소설, 신문 등의 문서를 단순히 모아놓은 것도 있지만 품사, 형태소, 등의 보조적 의미를 추가하고 쉬운 분석을 위해 구조적인 형태로 정리해 놓은 것도 포함됩니다.
'Development > Big Data, R, ...' 카테고리의 다른 글
6.Summary - 6. 학습결과 적용하기 (0) | 2020.01.27 |
---|---|
텍스트 데이터 전처리 (0) | 2020.01.26 |
신뢰도(conviction) (0) | 2020.01.24 |
Moravec's Paradox (모라벡의 역설) (0) | 2020.01.23 |
과소적합(underfitting) (0) | 2020.01.23 |