CODEDRAGON ㆍDevelopment/AI
비즈니스 도메인과 원천데이터 정보
데이터 수집을 위해서 데이터 수집자는 데이터 분석 목표를 이해하고, 비즈니스 도메인에 대한 이해를 바탕으로 원천 데이터를 탐색해야 합니다.
· 비즈니스 도메인 정보 이해
· 원천 데이터 정보
비즈니스 도메인의 이해를 통한 원천데이터 탐색 도식도
비즈니스 도메인 정보 이해
비즈니스 도메인 정보를 습득하기 위해서는 비즈니스 모델, 비즈니스 용어집, 비즈니스 프로세스로부터 관련 정보를 습득하고, 도메인 전문가 인터뷰를 통해 데이터의 종류, 유형, 특징 정보를 습득합니다.
구분 |
설명 |
비즈니스 모델 |
· 비즈니스 모델은 비즈니스 전개를 위해 필요한 구성요소 간의 상호 관계를 모델화시켜놓은 것입니다. |
비즈니스 용어집 |
· 특정 비즈니스 영역에서 사용되는 신뢰할 수 있는 용어 및 관계 사전입니다. |
비즈니스 프로세스 |
· 다양한 시스템과 비즈니스 unit들에 넓게 분산되어 있고 커스터마이즈되어 있는 복잡하고, 역동적인 실체로서 고객에게 가치를 전달하는 데 필요한 모든 순차적이거나 병렬적인 활동들의 집합입니다. |
도메인 전문가 인터뷰 |
· 도메인 전문가는 도메인 분야에 경험과 깊이 있는 지식을 가진 사람입니다. · 인터뷰를 통해 도메인에 사용되는 전문용어 및 다른 의미로 통용되는 일상용어를 익히고, 해당 분야에서 다루어지는 데이터의 종류, 유형, 특징 정보를 습득합니다. |
원천 데이터 정보
데이터 분석에 필요한 대상 원천 데이터의 수집 가능성, 데이터의 보안, 정확성을 탐색하고, 데이터 수집의 난이도, 수집 비용 등의 기초 자료를 수집할 수 있습니다.
구분 |
설명 |
데이터의 수집 가능성 |
원천 데이터 수집의 용이성과 데이터 발생 빈도를 탐색하고, 데이터 활용에 있어서 전처리 및 후처리 비용을 대략 산정할 수 있습니다. |
데이터의 보안 |
수집 대상 데이터의 개인정보 포함 여부, 지적 재산권 존재 여부를 판단하여 데이터분석 시 발생할 수 있는 문제를 예방합니다. |
데이터 정확성 |
데이터 분석 목적에 맞는 적절한 데이터 항목이 존재하고, 적절한 데이터 품질이 확보될 수 있는지 탐색해야 합니다. |
수집 난이도 |
원천 데이터의 존재 위치, 데이터의 유형, 데이터 수집 용량, 구축비용, 정제 과정의 복잡성을 고려하여 데이터를 탐색합니다. |
수집 비용 |
데이터를 수집하기 위해 발생할 수 있는 데이터 획득 비용을 산정할 수 있습니다. |
'Development > AI' 카테고리의 다른 글
4.Summary - 4.수집 데이터 검증모듈 개발하기 (0) | 2020.01.02 |
---|---|
1.Summary - 1.빅데이터 수집시스템 설계하기 (0) | 2020.01.02 |
tm_map() (0) | 2020.01.02 |
불용어 처리(Stopword Removal) (0) | 2020.01.01 |
과적합(overfitting) (0) | 2020.01.01 |