로지스틱 회귀분석(Logistic regression)

CODEDRAGON Development/Big Data, R, ...

반응형

 

 

 

로지스틱 회귀분석(Logistic regression)

·         로짓(logit)모형

·         명칭에 Regression(회귀)’이 들어가지만 회귀 알고리즘이 아니라 분류 알고리즘이므로 LinearRegression 혼동하면 됩니다.

·         로지스틱 회귀분석은 분석하고자 하는 대상들이 집단 혹은 이상의 집단(다변수 데이터)으로 나누어진 경우에 개별 관측치들이 어느 집단으로 분류 있는가를 분석하고 이를 예측하는 모형 개발하는데 사용되는 분석 방법으로 대표적인 통계 알고리즘입니다.

·         일반화선형모형(Generalized linear model) 특별한 경우로 로짓(logit)모형이라고도 합니다.

·         종속 변수의 값을 0또는 1 (이진 변수로) 표현할 있는 경우 사용합니다.

·         분석 목적이나 절차에 있어서는 일반 회귀분석과 유사하나 종속 변수 명목척도 측정된 범주형 질적 변수 경우에 사용한다는 점에서 차이가 있습니다.

·         반응 변수가 범주형 경우에 적용되는 회귀분석 모형입니다.

·         로지스틱 회귀 모형은 새로운 설명변수(예측변수) 값이 주어질 반응변수의 범주(또는 집단) 속할 확률이 얼마인지를 추정하여(예측 모형), 추정 확률을 기준치에 따라 분류하는 목적으로(분류 모형) 사용 수도 있습니다. 모형의 적합을 통해 추정된 확률을 사후확률(Posterior probability)라고 부르기도 합니다.

·         로지스틱 회귀 모델은 glm()함수 사용해 수행합니다. (R)

 

 

 

 

반응형