전체 글(14830)
-
1.Summary - 1.빅데이터 수집시스템 설계하기
데이터 수집 세부 계획서 목차 https://codedragon.tistory.com/9661 내,외부 데이터 수집시 데이터 수집의 불가 원인 및 대안 구분 설명 비즈니스 모델 · 비즈니스 모델은 비즈니스 전개를 위해 필요한 구성요소 간의 상호 관계를 모델화시켜놓은 것입니다. 비즈니스 용어집 · 특정 비즈니스 영역에서 사용되는 신뢰할 수 있는 용어 및 관계 사전입니다. 비즈니스 프로세스 · 다양한 시스템과 비즈니스 unit들에 넓게 분산되어 있고 커스터마이즈되어 있는 복잡하고, 역동적인 실체로서 고객에게 가치를 전달하는 데 필요한 모든 순차적이거나 병렬적인 활동들의 집합입니다. 도메인 전문가 인터뷰 · 도메인 전문가는 도메인 분야에 경험과 깊이 있는 지식을 가진 사람입니다. · 인터뷰를 통해 도메인에 사..
-
비즈니스 도메인과 원천데이터 정보
비즈니스 도메인과 원천데이터 정보데이터 수집을 위해서 데이터 수집자는 데이터 분석 목표를 이해하고, 비즈니스 도메인에 대한 이해를 바탕으로 원천 데이터를 탐색해야 합니다. · 비즈니스 도메인 정보 이해 · 원천 데이터 정보 비즈니스 도메인의 이해를 통한 원천데이터 탐색 도식도 비즈니스 도메인 정보 이해비즈니스 도메인 정보를 습득하기 위해서는 비즈니스 모델, 비즈니스 용어집, 비즈니스 프로세스로부터 관련 정보를 습득하고, 도메인 전문가 인터뷰를 통해 데이터의 종류, 유형, 특징 정보를 습득합니다.
-
imageio 패키지 - install
imageio 패키지 - install pip install imageio
-
Infinity
Infinity · NumPy에서는 무한대를 표현하기 위한 np.inf(infinity)함수를 제공합니다. · 1을 0으로 나누려고 하거나 0에 대한 로그 값을 계산하는 경우 무한대인 np.inf이 됩니다.
-
tm_map()
tm_map() 문서에 함수를 적용하여 변환된 결과를 반환합니다. http://bit.ly/2RXSKb1 parameter description x 코퍼스(Corpus) 또는 단어-문서(term-document) 행렬 FUN 변환에 사용할 함수 FUN 함수 사용자가 직접 만든 함수를 지정할 수 있고, {tm}패키지에서 제공하는 함수를 지정할 수도 있습니다. {tm} 제공하는 변환 함수 목록 변환 함수 설명 removeNumbers · 숫자를 제거합니다. removePunctuation · 문장 부호를 제거합니다. removeWords · 단어를 제거합니다. stemDocument · Porter's stemming algorithm을 사용하여 문서안의 어간을 추출합니다. stripWhitespace · ..
-
불용어 처리(Stopword Removal)
불용어 처리(Stopword Removal)· 일반적으로 코퍼스(Corpus)에서 자주 나타나는 단어는 학습 모델에서 학습이나 예측 프로세스에 실제로 기여하지 않아 다른 텍스트와 구별하지 못합니다.· 예를 들어 조사, 접미사, i, me, my, it, this, that, is, are 등과 같은 단어는 빈번하게 등장하지만, 실제 의미를 파악하는 데 크게 기여하지 않습니다.· 불용어는 to또는 the와 같은 용어들을 포함하고 있으며 사전 처리 단계에서 제거하는 것이 좋습니다. · 형태소 분석 결과로 입력된 단어들에 대하여 불용어 사전(불용어가 저장된 데이터베이스)을 참조하여 불필요한 키워드를 제거합니다. 즉, 형태소 분석 결과를 불용어 사전에서 검색하여 일치하는 내용이 나타나면 그 내용을 삭제하여 최적..