Development/Big Data, R, ...(885)
-
데이터 분석 기법 선정
데이터 분석 기법 선정적절한 분석 기법을 선택할 수 있습니다.
-
공분산 값 의미
공분산 값
-
R 코드 예시 - 데이터 분할
R 코드 예시 - 데이터 분할 {caret} Package로 createDataPartition()함수를 사용하여 iris data를 Species 기준으로 70%는 훈련용 데이터로 나머지 30%는 검증용 데이터로 데이터셋을 분할하고 검증하는 R Code 예시입니다.
-
3.Summary - 3.데이터 검증하기
통합 검증데이터 전환 결과 검증은 추출 검증, 전송 검증, 전환 검증, 적재 검증, 통합 검증이 있습니다. 그 중 통합 검증의 목적과 방법은 아래와 같습니다.
-
LOOCV(Leave-One-Out-Cross-Validation)
LOOCV · Leave-One-Out-Cross-Validation · 데이터 n개 중 하나만을 검정(Validation) Set으로 두고, 나머지를 학습(Training) Set으로 모델에 적합시키는 방법입니다. · 자료가 n개인 경우, 위 과정을 n번 반복 한 후 결과치들의 평균을 도출하여 사용합니다. http://bit.ly/2FS8IxU
-
모델이 복잡한 경우
모델이 복잡한 경우 CASE 1 Y와 X라는 변수들이 실제 관계는 1차 함수의 직선모양으로 나타납니다. 직선 주변으로 점들이 퍼진 것은 모두 노이즈 때문입니다. CASE 2 데이터에 4차 방정식의 복잡한 회귀식을 적용하면, 다음의 굽은 곡선으로 나타납니다. 해당 곡선은 노이즈를 설명하게 되고, 실제 X와 Y간의 관계를 잘 표현하지 못하는 문제를 갖게 됩니다.