Development/Big Data, R, ...(885)
-
Rfacebook 패키지 설치하기, Rfacebook 패키지 임포트
Rfacebook 패키지 설치하기install.packages("Rfacebook") > library(Rfacebook) 필요한 패키지를 로딩중입니다: rjson 필요한 패키지를 로딩중입니다: httpuv 다음의 패키지를 부착합니다: ‘Rfacebook’ The following object is masked from ‘package:methods’: getGroup > library(Rfacebook) >
-
빅데이터와 개인정보보호
빅데이터와 개인정보보호김지훈 박사님의 논문 '빅데이터와 개인정보보호' http://www.klri.re.kr/kor/publication/pubReportSmallView.do?seq=52&tseq=834&sseq=2402&gbn=J&typeCd=L 직접 다운로드
-
모형평가 - Step1: 데이터를 추출, 데이터를 추출 하는 이유, 모델 생성시 문제점, 데이터의 적정 수준 유지, 모델 복잡도에 따른 정확도 그래프
Step1: 데이터를 추출분류 분석 모형의 평가를 위해서는 먼저 전체 자료(raw data)에서 모형 구축을 위한 훈련용 데이터(training data)와 모형의 성과를 검증하기 위한 검증용 데이터(test data)를 추출합니다. 데이터를 추출 하는 이유모델을 만들 때 쓴 데이터는 평가 목적으로 사용할 수 없습니다.학습시 모델이 훈련 데이터를 전부 기억할 수 있으므로 훈련 데이터에 속한 어떤 데이터라도 정확히 맞출 수 있기 때문입니다. 이렇게 데이터를 기억한다는 것은 모델을 잘 일반화하지 않았다는 뜻입니다(다른 말로는 새로운 데이터에 대해서는 잘 작동하지 않는다는 것입니다). 모델 생성시 문제점주어진 데이터에서만 높은 성과를 보이는 모형의 과적합화(Overfitting)문제를 해결하기 위한 단계로 잘..
-
R for Data Science
R for Data Sciencehttp://r4ds.had.co.nz/
-
오분류표(Confusion matrix)
오분류표(Confusion matrix)· 오차행렬 ≒ 혼동행렬 ≒ 분류 결과표 ≒ 정보분류표· 대부분의 분류 분석 모형의 예측 결과는 분류 범주로 나타남에 따라 분류 분석 모형의 평가에는 오분류표가 일반적으로 사용됩니다.· 오분류표는 목표변수의 실제 범주와 모형에 의해 예측된 분류 범주 사이의 관계를 나타내는 표입니다.· Matrix는 Training 을 통한 Prediction 성능을 측정하기 위해 예측 value와 실제 value를 비교하기 위한 표· 타겟의 원래 클래스와 모형이 예측한 클래스가 일치하는지는 갯수로 센 결과 표· R패키지 {caret}의 confusionMatrix()함수를 사용해서 구할 수 있습니다.
-
다중모델을 이용한 자동차 보험 고객의 이탈예측(Customer Churn Prediction of Automobile Insurance by Multiple Models)
다중모델을 이용한 자동차 보험 고객의 이탈예측(Customer Churn Prediction of Automobile Insurance by Multiple Models) http://www.dbpia.co.kr/Journal/ArticleDetail/NODE00742929