'Development/Big Data, R, ...' 카테고리의 글 목록 (33 Page)

caret 패키지

caret 패키지 · 지원하는 기능이 기계 학습 전반에 걸쳐 있고 사용이 편리한 패키지 입니다. · 교차 분석, 모델 성능 평가, 시각화 등에서 자주 사용됩니다. · 각 모형의 오분류표를 도출하기 위한 confusionMatrix()함수를 제공합니다. https://cran.r-project.org/web/packages/caret/index.html

시계열 데이터 분석 목적

시계열 데이터 분석 목적

머신러닝(Machine Learning)

머신러닝(Machine Learning) · ≒ 기계학습 ≒ data mining ≒ 패턴 인식 · 인공지능의 한 분야 · 더 똑똑해지는 법을 배우는 기계를 만드는 기술입니다. 모든 것을 알려주는 것이 아니라 컴퓨터가 스스로 세상을 관찰하고 배울 수 있도록 가르치는 것입니다. · 주어진 데이터들을 분석하여 그로부터 일반적인 규칙이나 새로운 지식을 자동적으로 추출해 내는 방법을 말합니다. 그 규칙을 새로운 데이터에 적용해서 새로운 결과를 도출하게 됩니다. · 경험적 데이터를 기반으로 학습(Learning)을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 고안하고 구축하는 연구 분야입니다. · 데이터를 이용해서 모델을 만들어 내는 방법입니다. · 사람이 데이터를 분석해서 모델..

이상값 처리

이상값 처리 일정 기간을 할애해 분석 기준을 수립하고, 해당 기준에 의거해 드러나지 않는 것은 무시하고 진행해야 합니다. 그렇지 않으면 분석 데이터와 결과 자체가 모두 엉망이돼 관리가 불가능해집니다.

lm()

lm() · lm(linear mode) · 회귀분석분석 수행 함수 · 상관분석을 실시한 결과를 이용해 가장 높은 유의성을 갖는 변수가 데이터 사용량에 미치는 영향을 추정하기 위해 단순회귀분석을 수행합니다. · 회귀직선(선형회귀)를 그리는 함수로 반환값은 lm의 객체입니다. · 단순 선형회귀를 기준으로 y=a + bx라는 회귀함수(회귀곡선)을 구하여 독립변수(x)에 따른 종속변수(y)값을 예측하는 모델링입니다. 인자 설명 formula · 포뮬러 · 종속변수~독립변수 data · 포뮬러를 적용할 데이터 · 보통 데이터 프레임 subset weights na.action · NA가 포함된 행을 다루는 방법을 설정합니다. · na.fail · na.omit · na.exclude method = "qr" m..

가설 검정의 오류

가설 검정의 오류통계적인 방법에 근거하여 주어진 가설을 검증하는 데 있어 모집단 전체를 통해 검증하는 것이 아닌 모집단으로부터 추출된 표본을 기반으로 모집단에 대한 결론을 내리는 것이기 때문에 다음과 같은 통계적인 오류가 발생할 가능성이 항상 존재합니다. · 제1종 오류· 제2종 오류 제1종 오류귀무가설이 참인데 잘못하여 이를 기각하게 되는 오류를 제1종 오류라고 합니다. 제2종 오류귀무가설이 참이 아닌데 잘못하여 이를 채택하게 되는 오류를 제2종 오류라고 합니다.

CodeDragon

CodeDragon

태그

최근글

댓글

공지사항

아카이브

Development/Big Data, R, ...(885)

티스토리툴바