Development/AI(891)
-
데이터 전처리(Data preprocessing)
데이터 전처리(Data preprocessing) · 데이터 정제 (Data Cleaning and Text Preprocessing) · ≒ 데이터 클리닝(data cleaning) · 기계가 텍스트를 이해할 수 있도록 텍스트를 정제합니다. · 전처리는 단순히 비정형 데이터를 정형데이터로 변경하는 것뿐 아니라 전체 입력 정보 중 실제로 출력 데이터의 결정에 영향을 미칠만한 핵심 정보를 선택하거나 복수의 입력 데이터를 조합하여 새로운 입력 데이터를 만드는 것도 전처리에서 이루어집니다. · 전처리 과정은 최종 예측 성능에 큰 영향을 끼칩니다. · 데이터 정제를 먼저 하고 나서 테스트 데이터를 분리하거나, 데이터를 분리한 다음 정제하는 방법을 택할 수도 있습니다. 데이터 전처리 철차
-
데이터 정제 방법
데이터 정제 방법 · 불일치나 오류의 수정, 행과 열의 제목을 위한 표준 라벨의 사용, 숫자나 날짜, 수량등이 적절히 표현되도록 합니다. · 기계가 읽을 수 없는 요소를 제거합니다. · 적합한 파일 포맷으로 변환합니다.
-
데이터 정제
데이터 정제 · 데이터 셋을 쉽게 사용할 수 있도록 하는 과정입니다. · 빅데이터 처리에서 가장 중요한 작업 중 하나는 정제입니다. · 정제가 제대로 이루어지지 않을 경우 데이터의 구성이 일관되지 않으므로 빅데이터를 분석하는데 문제가 생기게 됩니다. · 다양한 매체로부터 데이터를 수집하여 원하는 형태로 변환하는 것입니다.
-
동전 던지기
동전 던지기
-
이상치(anomaly) 처리
이상치(anomaly) 처리
-
맥주와 기저귀
맥주와 기저귀 대형 마트는 기저귀를 사러 왔다가 맥주까지 사가는 사내의 습성을 보고 (기저귀를 사는 고객은 맥주를 동시에 구매한다는 연관규칙을 알아낸 것을 통해) 기저귀와 맥주를 인접한 진열대에 위치해 놓으니 매출 증대를 꾀할 수 있었습니다. https://bit.ly/33Y7R6B 이 이야기는 전 세계 마케팅 부서를 통해 전파되고 있으며, 키노트부터 잡담, 해커톤에서 늦은 밤까지 이어진 코드 잼 등 모든 곳에서 회자되고 있습니다 토마스 블리촉(Thomas Blischok)은 마인드멜드(mindmeld)라는 회사의 CEO일 때 과거, 현재, 미래의 데이터 마이닝에 관한 웹 캐스트 패널이었으며, 맥주와 기저귀 스토리를 낳은 데이터 연구를 하고 있었습니다. 그 연구는 1990년대 초반에 실행되었는데, 그의 ..