CODEDRAGON ㆍDevelopment/Big Data, R, ...
머신러닝(Machine Learning)
· ≒ 기계학습
≒ data mining ≒ 패턴 인식
· 인공지능의 한 분야
· 더 똑똑해지는 법을 배우는 기계를 만드는 기술입니다. 모든 것을 알려주는 것이 아니라 컴퓨터가 스스로 세상을 관찰하고 배울 수 있도록 가르치는 것입니다.
· 주어진 데이터들을 분석하여 그로부터 일반적인 규칙이나 새로운 지식을 자동적으로 추출해 내는 방법을 말합니다. 그 규칙을 새로운 데이터에 적용해서 새로운 결과를 도출하게 됩니다.
· 경험적 데이터를 기반으로 학습(Learning)을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 고안하고 구축하는 연구 분야입니다.
· 데이터를 이용해서 모델을 만들어 내는 방법입니다.
· 사람이 데이터를 분석해서 모델을 만드는 것이 아니라 다양한 머신러닝 알고리즘을 통해 기계가 스스로 모델을 찾도록 하는 것입니다.
· 즉, 머신러닝은 기존 데이터를 이용해 아직 일어나지 않은 미지의 일을 예측하기 위해 만들어진 기법입니다.
Arthur Samuel, 1959
"Field of study that gives computers the ability to learn without being explicitly programmed" |
컴퓨터에게 배울 수 있는 능력, 즉 코드로 정의하지 않은 동작을 실행하는 능력에 대한 연구분야를 말합니다.
가능한 모든 경우의 수를 프로그래머가 정의해주지 않더라도, 데이터를 통한 학습을 하여 최적의 판단이나 예측을 가능하게 해주는 것을 말합니다.
데이터 (Data) |
학습 (Learning) |
모델 (Model) |
사과 데이터 |
-> |
사과를 분류해내는 모델 |
스팸메일 데이터 |
-> |
스팸 메일을 구분해내는 모델 |
악성코드 데이터 |
-> |
악성코드를 탐지해내는 모델 |
금융사기 데이터 |
-> |
금융사기를 탐지해내는 모델 |
고양이 사진 데이터 |
-> |
사진에서 고양이를 구분해 내는 모델 |
바둑 기보 데이터 |
-> |
바둑에서 이기는 방법을 구분해 내는 모델 |
수술 환자의 수술 전 상태와 수술 후의 생존율을 정리해 놓은 데이터 |
-> |
수술하기 전에 수술 후의 생존율을 수치로 예측하는 모델 |
'Development > Big Data, R, ...' 카테고리의 다른 글
caret 패키지 (0) | 2020.02.11 |
---|---|
시계열 데이터 분석 목적 (0) | 2020.02.09 |
이상값 처리 (0) | 2020.02.08 |
lm() (0) | 2020.02.07 |
가설 검정의 오류 (0) | 2020.02.07 |