Development/Big Data, R, ...(885)
-
caret 패키지
caret 패키지 · 지원하는 기능이 기계 학습 전반에 걸쳐 있고 사용이 편리한 패키지 입니다. · 교차 분석, 모델 성능 평가, 시각화 등에서 자주 사용됩니다. · 각 모형의 오분류표를 도출하기 위한 confusionMatrix()함수를 제공합니다. https://cran.r-project.org/web/packages/caret/index.html
-
시계열 데이터 분석 목적
시계열 데이터 분석 목적
-
머신러닝(Machine Learning)
머신러닝(Machine Learning) · ≒ 기계학습 ≒ data mining ≒ 패턴 인식 · 인공지능의 한 분야 · 더 똑똑해지는 법을 배우는 기계를 만드는 기술입니다. 모든 것을 알려주는 것이 아니라 컴퓨터가 스스로 세상을 관찰하고 배울 수 있도록 가르치는 것입니다. · 주어진 데이터들을 분석하여 그로부터 일반적인 규칙이나 새로운 지식을 자동적으로 추출해 내는 방법을 말합니다. 그 규칙을 새로운 데이터에 적용해서 새로운 결과를 도출하게 됩니다. · 경험적 데이터를 기반으로 학습(Learning)을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 고안하고 구축하는 연구 분야입니다. · 데이터를 이용해서 모델을 만들어 내는 방법입니다. · 사람이 데이터를 분석해서 모델..
-
이상값 처리
이상값 처리 일정 기간을 할애해 분석 기준을 수립하고, 해당 기준에 의거해 드러나지 않는 것은 무시하고 진행해야 합니다. 그렇지 않으면 분석 데이터와 결과 자체가 모두 엉망이돼 관리가 불가능해집니다.
-
lm()
lm() · lm(linear mode) · 회귀분석분석 수행 함수 · 상관분석을 실시한 결과를 이용해 가장 높은 유의성을 갖는 변수가 데이터 사용량에 미치는 영향을 추정하기 위해 단순회귀분석을 수행합니다. · 회귀직선(선형회귀)를 그리는 함수로 반환값은 lm의 객체입니다. · 단순 선형회귀를 기준으로 y=a + bx라는 회귀함수(회귀곡선)을 구하여 독립변수(x)에 따른 종속변수(y)값을 예측하는 모델링입니다. 인자 설명 formula · 포뮬러 · 종속변수~독립변수 data · 포뮬러를 적용할 데이터 · 보통 데이터 프레임 subset weights na.action · NA가 포함된 행을 다루는 방법을 설정합니다. · na.fail · na.omit · na.exclude method = "qr" m..
-
가설 검정의 오류
가설 검정의 오류통계적인 방법에 근거하여 주어진 가설을 검증하는 데 있어 모집단 전체를 통해 검증하는 것이 아닌 모집단으로부터 추출된 표본을 기반으로 모집단에 대한 결론을 내리는 것이기 때문에 다음과 같은 통계적인 오류가 발생할 가능성이 항상 존재합니다. · 제1종 오류· 제2종 오류 제1종 오류귀무가설이 참인데 잘못하여 이를 기각하게 되는 오류를 제1종 오류라고 합니다. 제2종 오류귀무가설이 참이 아닌데 잘못하여 이를 채택하게 되는 오류를 제2종 오류라고 합니다.