Development/Big Data, R, ...(885)
-
5.Summary - 5. 모델성능 평가하기
K-교차검증(K-fold Cross-Validation) 단일한 훈련 데이터와 평가 데이터로 1회만 분할하는 것이 아니라, 전체 데이터를 K개로 등분한 뒤, k=1,2...K번째 데이터 세트를 차례로 검증 데이터(Validation Data)로 사용하고 나머지 데이터 세트를 모델 훈련에 반복적으로 사용하면서 모델 성능을 측정하는 방법입니다. 결국 K-교차 검증은 데이터 세트를 훈련 데이터와 검증 데이터(Validation Data)로 나누어 모델링 및 성능 평가를 K회 반복하게 되며, 모든 K개 중첩에 대한 성능 평가결과들에 대한 평균치를 통해 최종 모델 성능 평가를 도출할 수 있습니다. https://codedragon.tistory.com/6884 https://codedragon.tistory.co..
-
불순도(impurity)
불순도(impurity) · 불순도는 노드에 여러 분류가 섞여 있을수록 높아집니다↑. 반면 하나의 분류만 있다면 낮아집니다↓. · 가장 흔히 사용하는 불순도 함수는 지니 불순도(Gini Impurity)입니다. 불순도 함수 불순도 함수 f가 있다고 할 때 노드 A의 불순도 I(A)는 다음과 같이 정의합니다.
-
3.Summary - 3. 지도모델 적용하기
R 코드 예시 - 나이브 베이즈 나이브 베이즈 기법을 적용하여 iris dataset를 훈련과 검증 그리고 분류 결과를 도출하는 R code 예시입니다.훈련용 데이터셋은 iris_train, 검증용 데이터셋은 iris_test 로 저장되어 있습니다.
-
게슈탈트 원리(The Gestalt Principles of Visual Perception)
게슈탈트 원리(The Gestalt Principles of Visual Perception) · 1900년대 초 독일의 심리학파인 게슈탈트(Gestalt) 학파에 의해 활발하게 연구되었으며, 시지각의 게슈탈트 원리(The Gestalt Principles of Visual Perception)로 정립되었습니다. · 뇌가 색과 형태의 조각들을 하나의 패턴으로 보는 원리로서, 게슈탈트는 모양이나 도형을 의미하는 독일어입니다.
-
Medal.csv
-
ezpickr 패키지
ezpickr 패키지· ≒ 이지피커· 한국 개발자가 만든 패키지· 데이터 파일 포맷마다 필요한 패키지와 함수를 사용해야 했던것을 하나의 함수로 호출할 수 있도록 만든 패키지입니다.· 제공되는 pick() 함수를 호출하면 GUI 파일 선택 대화상자가 열리고, 대화상자에서 선택한 파일의 확장자에 따라 적절한 파일 임포팅 패키지::함수를 자동으로 매치시킵니다.· 예를 들면, 파일선택 대화상자에서 "csv" 확장자 파일을 골라 클릭했다면, 내부적으로 readr::read_csv() 함수가 호출되어 선택한 파일을 tibble 형태로 R 세션에 반환합니다. https://cloud.r-project.org/web/packages/ezpickr/index.html http://bit.ly/2D4cqAihttp://b..