데이터 수집 불가 원인 및 대안
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
데이터 수집이 쉽지 않은 경우 수집 주기 및 방법에 대한 대안을 마련한다.
· 데이터 수집이 항상 원활한 것은 아닙니다.
· 시스템의 특수성으로 인해 발생 데이터가 외부 또는 내부와 네트워크로 연결되어 있지 않으면 분석에 필요한 데이터를 네트워크를 통해 수집하기 어렵게 됩니다.
데이터 수집 불가 원인 및 대안
· 데이터 수집이 쉽지 않은 원인을 파악해야 합니다.
· 데이터 수집이 쉽지 않은 경우는 다양한 원인에 의해서 발생하지만 크게 아래와 같이 구분할 수 있다.
구분 | 원인 | 대안 |
시스템 | 수집 시스템 오류 | 수집 시스템의 구성 및 프로그램을 수정하여 해결 |
시스템 | 네트워크 오류 | 방화벽, 네트워크 라우팅 설정 문제를 파악하여 해결 |
보안 | 데이터의 암호화 | 원천 데이터가 암호화되어 있는 경우, 인증서를 설치 및 권한 습득을 통해 해결 |
보안 | 폐쇄망 데이터 | 외부와 단절된 폐쇄망 데이터의 경우에는 직접 데이터를 로컬에서 추출하여 물리적으로 이동. 이때, 보안관리자의 승인을 득하여 반출한다. |
저장 용량 | 데이터의 방대함 | 수집 데이터의 용량이 커 직접 수집이 불가한 경우 수집 주기를 조절하거나, 특정 조건의 구간 데이터만을 추출하여 저장 |
저장 용량 | 저장 공간의 부족 | 내부 시스템의 용량산정을 다시 하여 저장 공간의 확보 |
'Development > Big Data, R, ...' 카테고리의 다른 글
주성분 분석(PCA; Principal Component Analysis) (0) | 2021.08.18 |
---|---|
가용어, 불용어, 키워드 개념 (0) | 2021.08.11 |
시그모이드 함수(Sigmoid function) (0) | 2021.08.03 |
빅데이터에서의 데이터, 데이터 시각화(Data Visualization) (0) | 2021.08.02 |
pima-indiansdiabetes (0) | 2021.07.26 |