CODEDRAGON ㆍDevelopment/Big Data, R, ...
데이터 수집 세부 계획서 목차
https://codedragon.tistory.com/9661
내,외부 데이터 수집시 데이터 수집의 불가 원인 및 대안
구분 |
원인 |
대안 |
시스템 |
수집 시스템 오류 |
수집 시스템의 구성 및 프로그램을 수정하여 해결 |
시스템 |
네트워크 오류 |
방화벽, 네트워크 라우팅 설정 문제를 파악하여 해결 |
보안 |
데이터의 암호화 |
원천 데이터가 암호화되어 있는 경우, 인증서를 설치 및 권한 습득을 통해 해결 |
보안 |
폐쇄망 데이터 |
외부와 단절된 폐쇄망 데이터의 경우에는 직접 데이터를 로컬에서 추출하여 물리적으로 이동. 이때, 보안관리자의 승인을 득하여 반출한다. |
저장 용량 |
데이터의 방대함 |
수집 데이터의 용량이 커 직접 수집이 불가한 경우 수집 주기를 조절하거나, 특정 조건의 구간 데이터만을 추출하여 저장 |
저장 용량 |
저장 공간의 부족 |
내부 시스템의 용량산정을 다시 하여 저장 공간의 확보 |
https://codedragon.tistory.com/9475
비즈니스 도메인 정보 이해
비즈니스 도메인 정보를 습득하기 위해서는 비즈니스 모델, 비즈니스 용어집, 비즈니스 프로세스로부터 관련 정보를 습득하고, 도메인 전문가 인터뷰를 통해 데이터의 종류, 유형, 특징 정보를 습득합니다.
구분 |
설명 |
비즈니스 모델 |
· 비즈니스 모델은 비즈니스 전개를 위해 필요한 구성요소 간의 상호 관계를 모델화시켜놓은 것입니다. |
비즈니스 용어집 |
· 특정 비즈니스 영역에서 사용되는 신뢰할 수 있는 용어 및 관계 사전입니다. |
비즈니스 프로세스 |
· 다양한 시스템과 비즈니스 unit들에 넓게 분산되어 있고 커스터마이즈되어 있는 복잡하고, 역동적인 실체로서 고객에게 가치를 전달하는 데 필요한 모든 순차적이거나 병렬적인 활동들의 집합입니다. |
도메인 전문가 인터뷰 |
· 도메인 전문가는 도메인 분야에 경험과 깊이 있는 지식을 가진 사람입니다. · 인터뷰를 통해 도메인에 사용되는 전문용어 및 다른 의미로 통용되는 일상용어를 익히고, 해당 분야에서 다루어지는 데이터의 종류, 유형, 특징 정보를 습득합니다. |
https://codedragon.tistory.com/10037
'Development > Big Data, R, ...' 카테고리의 다른 글
빅데이터 품질 요소 및 품질 전략 (0) | 2020.01.02 |
---|---|
4.Summary - 4.수집 데이터 검증모듈 개발하기 (0) | 2020.01.02 |
비즈니스 도메인과 원천데이터 정보 (0) | 2020.01.02 |
tm_map() (0) | 2020.01.02 |
불용어 처리(Stopword Removal) (0) | 2020.01.01 |