로지스틱 회귀분석(Logistic regression)
로지스틱 회귀분석(Logistic regression)
· 로짓(logit)모형
· 명칭에 ‘Regression(회귀)’이 들어가지만 회귀 알고리즘이 아니라 분류 알고리즘이므로 LinearRegression과 혼동하면 안 됩니다.
· 로지스틱 회귀분석은 분석하고자 하는 대상들이 두 집단 혹은 그 이상의 집단(다변수 데이터)으로 나누어진 경우에 개별 관측치들이 어느 집단으로 분류될 수 있는가를 분석하고 이를 예측하는 모형을 개발하는데 사용되는 분석 방법으로 대표적인 통계 알고리즘입니다.
· 일반화선형모형(Generalized linear model)의 특별한 경우로 로짓(logit)모형이라고도 합니다.
· 종속 변수의 값을 0또는 1로 (이진 변수로) 표현할 수 있는 경우 사용합니다.
· 분석 목적이나 절차에 있어서는 일반 회귀분석과 유사하나 종속 변수가 명목척도로 측정된 범주형 질적 변수인 경우에 사용한다는 점에서 차이가 있습니다.
· 반응 변수가 범주형인 경우에 적용되는 회귀분석 모형입니다.
· 로지스틱 회귀 모형은 새로운 설명변수(예측변수)의 값이 주어질 때 반응변수의 각 범주(또는 집단)에 속할 확률이 얼마인지를 추정하여(예측 모형), 추정 확률을 기준치에 따라 분류하는 목적으로(분류 모형) 사용될 수도 있습니다. 이 때 모형의 적합을 통해 추정된 확률을 사후확률(Posterior probability)라고 부르기도 합니다.
· 로지스틱 회귀 모델은 glm()함수를 사용해 수행합니다. (R)