Development/Big Data, R, ...(887)
-
일반화 방법 - 속성 줄이기(Attribute Reduction)
속성 줄이기(Attribute Reduction) 오컴의 면도날(Occam’s Razor) 방법으로 "같은 현상을 설명하는 두 개의 이론이 있다면 간단한 쪽을 선택하라"는 의미입니다. Model B와 Model C 중 어느 것을 택할 것인가 선택의 상황이 있을 때 흔히 적용되는 방법입니다. 오캄의 원리에 의해서 주어진 점들을 추정 Model B를 선택하게 됩니다. 복잡성이 너무 높은 경우 과적합이 될 확률이 높습니다. (Model B보다 Model C가 과적합이 될 확률이 높습니다.) 결과에 크게 영향을 주지 않는 속성을 제거합니다. (Model C에서 결과에 영향을 주지 않는 값을 제거하여 Model B와 같이 좀 더 단순한 모델로 만들어줍니다.)
-
빅데이터 저장 관리시스템
빅데이터 저장 관리시스템 빅데이터 저장 관리시스템이란 대용량 데이터 집합을 저장하고 관리하는 시스템입니다. 빅데이터 저장방식은 크게 분산 파일시스템 방식과 데이터베이스 방식이 있습니다. · 분산 파일 시스템 방식 · 데이터베이스 방식 분산 파일 시스템 방식 · 빅데이터를 확장 가능한 분산 파일 형태로 저장하는 방식입니다. · 대표적인 예는 HDFS, 구글의 GFS 등이 있습니다. · 분산 파일 시스템 저장 방식은 저사양 서버들을 활용하여 대용량, 분산, 데이터 집중형의 애플리케이션을 지원하면 사용자들에게 고성능 fault-tolerance 환경을 제공합니다. https://codedragon.tistory.com/9080 https://codedragon.tistory.com/9627 https://co..
-
콘솔화면 지우기 - RStudio
콘솔화면 지우기 Ctrl+L
-
[RStudio] 한글 깨짐 현상 해결하기
Rstudio 한글 깨짐 현상 해결하기 [Tool] >> [Global Options…] [Code] >> [Saving]탭 >> [Change…] 원하는 인코딩 타입 선택 >> [OK] [Apply] >> [OK]
-
빅데이터 활용 사례 2 - 마이크론 테크놀로지(Micron Technology), 코카콜라(Coca-Cola), 리츠칼튼 호텔(Ritz-Carlton), 할리우드(hollywood),
마이크론 테크놀로지(Micron Technology) 반도체 제조기업인 마이크론 테크놀로지는 제품생산시간 분석을 통해 비용을 절감하였습니다. 제품생산에 영향을 미치는 요소 분석을 통해 작업시간 절감 및 업무 효율을 증대하고 제품생산과 관계된 의사결정에 필요한 과학적 근거를 마련하게 되었습니다. https://www.micron.com/ https://en.wikipedia.org/wiki/Micron_Technology https://ko.wikipedia.org/wiki/%EB%A7%88%EC%9D%B4%ED%81%AC%EB%A1%A0_%ED%85%8C%ED%81%AC%EB%86%80%EB%A1%9C%EC%A7%80 코카콜라(Coca-Cola) SNS 데이터 활용을 통해 제품 판매 의사결정을 반영하고 ..
-
조건부 확률(Conditional probability)
조건부 확률(Conditional probability) 사건 A가 일어났다는 가정하의 사건 B의 확률을 의미합니다. the probability of an event(A), given that another(B) has already courred. 사건 A가 주어졌을 때 조건부 확률은 P(B|A)와 같이 표시하고, 다음과 같이 정의합니다. 이 확률은 P(A) >0일때만 정의가 됩니다. A와 B가 서로 영향을 주지 않는 경우 두 사건 A, B가 P(A∩B)=P(A)*P(B)를 만족하면 서로 독립이라고 합니다. 두 사건 A, B가 독립이라면 P(B|A) = P(B)가 됩니다. 따라서 사건B의 확률은 A가 일어났다는 가정하에서의 B의 조건부확률과 동일합니다. 즉, 사건 B의 확률은 사건 A가 일어났는지 여..