Development/Big Data, R, ...(883)
-
빅데이터 활용 사례 2 - 마이크론 테크놀로지(Micron Technology), 코카콜라(Coca-Cola), 리츠칼튼 호텔(Ritz-Carlton), 할리우드(hollywood),
마이크론 테크놀로지(Micron Technology) 반도체 제조기업인 마이크론 테크놀로지는 제품생산시간 분석을 통해 비용을 절감하였습니다. 제품생산에 영향을 미치는 요소 분석을 통해 작업시간 절감 및 업무 효율을 증대하고 제품생산과 관계된 의사결정에 필요한 과학적 근거를 마련하게 되었습니다. https://www.micron.com/ https://en.wikipedia.org/wiki/Micron_Technology https://ko.wikipedia.org/wiki/%EB%A7%88%EC%9D%B4%ED%81%AC%EB%A1%A0_%ED%85%8C%ED%81%AC%EB%86%80%EB%A1%9C%EC%A7%80 코카콜라(Coca-Cola) SNS 데이터 활용을 통해 제품 판매 의사결정을 반영하고 ..
-
조건부 확률(Conditional probability)
조건부 확률(Conditional probability) 사건 A가 일어났다는 가정하의 사건 B의 확률을 의미합니다. the probability of an event(A), given that another(B) has already courred. 사건 A가 주어졌을 때 조건부 확률은 P(B|A)와 같이 표시하고, 다음과 같이 정의합니다. 이 확률은 P(A) >0일때만 정의가 됩니다. A와 B가 서로 영향을 주지 않는 경우 두 사건 A, B가 P(A∩B)=P(A)*P(B)를 만족하면 서로 독립이라고 합니다. 두 사건 A, B가 독립이라면 P(B|A) = P(B)가 됩니다. 따라서 사건B의 확률은 A가 일어났다는 가정하에서의 B의 조건부확률과 동일합니다. 즉, 사건 B의 확률은 사건 A가 일어났는지 여..
-
Machine learning cheat sheet - pdf
Machine learning cheat sheet https://bit.ly/3cPNE9C 직접 다운로드
-
ERROR-‘slam’이라고 불리는 패키지가 없습니다, 패키지 ‘slam’(들)이 사용가능하지 않습니다
오류메시지 tm 패지지 설치지 발생하는 오류메시지 입니다. ‘slam’이라고 불리는 패키지가 없습니다, 패키지 ‘slam’(들)이 사용가능하지 않습니다 > library(tm) 필요한 패키지를 로딩중입니다: NLP Error in loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) : ‘slam’이라고 불리는 패키지가 없습니다 추가정보: 경고메시지(들): 1: 패키지 ‘tm’는 R 버전 3.3.2에서 작성되었습니다 2: 패키지 ‘NLP’는 R 버전 3.3.2에서 작성되었습니다 에러: package or namespace load failed for ‘tm’ > install.packages("slam") ‘C:/Users/codedrago..
-
DataSet - Orange, 데이터의 기술 통계 정보 확인하기
Orange · R의 내장 데이터셋 입니다. · 오렌지 나무의 성정에 대한 데이터 셋입니다. · 오렌지 나무의 종류, 연령, 둘레를 저장한 데이터 데이터의 기술 통계 정보 확인하기 # ---------------------------------------- # 데이터의 기술 통계 정보 확인하기 # 데이터를 불러옵니다. > data("Orange") > data("Orange", package="datasets") > #전체 데이터의 타입 확인하기 > class(Orange) [1] "nfnGroupedData" "nfGroupedData" "groupedData" "data.frame" > # 기본으로 6개의 데이터만 출력하여 일부 데이터 확인하기(값, 컬럼 구조등) > head(Orange) Tree ..
-
카이제곱 검정(Chi-Squared Test)
카이제곱 검정(Chi-Squared Test) · 기대빈도 간에 얼마만큼의 차이가 있는지(실제로 나온 관찰빈도와 각 셀에서 통계적으로 기대할 수 있는 빈도) 카이제곱 분포를 참조해 통계적으로 검증하는 통계기법입니다. · 카이제곱 분포에 기초한 통계적 방법으로, 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검증하기 위해 사용되는 검증방법입니다 · 자료가 빈도로 주어졌을 때, 특히 명목척도 자료의 분석에 이용됩니다. · 둘 간의 관계가 독립이라면 해당 변수는 모델링에 적합하지 않은 것으로 볼 수 있습니다. 반대로 독립이 아니라면 모델링에 중요한 변수로 볼 수 있습니다 http://bit.ly/2OEug4e https://en.wikipedia.org/wiki/Chi-squared_test