Development/AI(891)
-
subset()
subset()· split( )과 유사하지만 전체를 부분으로 구분하는 대신 조건을 만족하는 특정 부분만 취하는 용도로 사용합니다.· subset()은 조건을 만족하는 데이터를 반환합니다. 인자 설명 x 일부를 취할 객체 subset 데이터를 취할 것인지 여부 select 데이터 프레임의 경우 선택하고자 하는 컬럼을 지정합니다. 특정 컬럼을 제외하고자 한다면 -를 컬럼 이름 앞에 붙여줍니다.
-
R packages
R packages http://r-pkgs.had.co.nz/
-
ggthemes 패키지 설치하기, ggthemes 패키지 임포트
ggthemes 패키지 설치하기 > library("ggthemes") >
-
Rfacebook 패키지 설치하기, Rfacebook 패키지 임포트
Rfacebook 패키지 설치하기install.packages("Rfacebook") > library(Rfacebook) 필요한 패키지를 로딩중입니다: rjson 필요한 패키지를 로딩중입니다: httpuv 다음의 패키지를 부착합니다: ‘Rfacebook’ The following object is masked from ‘package:methods’: getGroup > library(Rfacebook) >
-
빅데이터와 개인정보보호
빅데이터와 개인정보보호김지훈 박사님의 논문 '빅데이터와 개인정보보호' http://www.klri.re.kr/kor/publication/pubReportSmallView.do?seq=52&tseq=834&sseq=2402&gbn=J&typeCd=L 직접 다운로드
-
모형평가 - Step1: 데이터를 추출, 데이터를 추출 하는 이유, 모델 생성시 문제점, 데이터의 적정 수준 유지, 모델 복잡도에 따른 정확도 그래프
Step1: 데이터를 추출분류 분석 모형의 평가를 위해서는 먼저 전체 자료(raw data)에서 모형 구축을 위한 훈련용 데이터(training data)와 모형의 성과를 검증하기 위한 검증용 데이터(test data)를 추출합니다. 데이터를 추출 하는 이유모델을 만들 때 쓴 데이터는 평가 목적으로 사용할 수 없습니다.학습시 모델이 훈련 데이터를 전부 기억할 수 있으므로 훈련 데이터에 속한 어떤 데이터라도 정확히 맞출 수 있기 때문입니다. 이렇게 데이터를 기억한다는 것은 모델을 잘 일반화하지 않았다는 뜻입니다(다른 말로는 새로운 데이터에 대해서는 잘 작동하지 않는다는 것입니다). 모델 생성시 문제점주어진 데이터에서만 높은 성과를 보이는 모형의 과적합화(Overfitting)문제를 해결하기 위한 단계로 잘..