CODEDRAGON ㆍDevelopment/Big Data, R, ...
summary() 함수의 결과 - 회귀모델
> summary(m) Call: Residuals: Coefficients: Residual standard error: 15.38 on 48 degrees of freedom |
|
|
> |
항목 |
설명 |
|
Call: |
· 회귀분석에 사용된 모델 식 · 어떤 포뮬러를 사용해 수행했는지 알려줍니다. |
|
Residuals: |
· 잔차 · 회귀선의 값과 실제 관측 값의 차이를 각 분위수로 표시합니다. |
|
Coefficients: |
· 절편 · 독립변수 등에 대한 회귀계수(모델의 계수)와 이 계수들의 통계적 유의성을 표시합니다.
|
|
Residual standard error |
· 잔차의 표준오차와 자유도를 나타냅니다. |
|
Multiple R-squared: |
· 결정 계수(R-squared) · R2으로도 표시합니다. · 추정된 회귀선이 '실제 관측 값을 얼마나 잘 설명하는가'를 나타냅니다. · 0에서 1사이의 값을 가지며 1은 실제 관측값들이 회귀선 상에 위치함을 의미합니다. · Multiple R-squared, Adjusted R-squared는 모델이 데이터의 분산을 얼마나 설명하는지를 알려줍니다.
|
|
Adjusted R-squared: |
· 수정된 결정 계수(Adjusted R-squred) · 주로 다중회귀분석에서 독립변수를 증가시키면 결정계수가 올라가는 것에 대한 대안으로 사용합니다. · 모델이 대상 변수의 몇 %l를 설명하는지를 확인합니다. · 결정계수(Multiple R-squared)와 차이가 크면 회귀모형을 재검토해야 합니다. |
|
F-statistic: |
· F 통계량 · 모델이 통계적으로 얼마나 의미가 있는지(유의성)를 알려줍니다. · 계수 중 하나라도 0이 아닌 것이 있다면 그 모형은 유의미하다고 판단합니다. · F 통계량은 MSR/MSE의 비율을 F 분포를 사용해 검정한 것입니다. · summary()가 보여주는 F 통계량은 anova() 함수를 사용해 직접 구할 수 있습니다. · t value의 값을 제곱한 값이 F 통계량입니다.
|
|
p-value |
· 각 변수가 대상 변수에 유의하게 영향을 미치는 지를 확인하기 위해 사용합니다. · p-value를 보면 0.05하에 있으면 모형은 유의합니다. · 0.05보다 작은 경우 각 변수는 유의하게 결과 변수를 설명한다고 볼 수 있습니다.
|
'Development > Big Data, R, ...' 카테고리의 다른 글
AI 기업이 가장 많은 도시 TOP5 - 2018년 7월 (0) | 2019.01.12 |
---|---|
khaiii(Kakao Hangul Analyzer III) - 카카오에서 개발한 세 번째 형태소분석기 (0) | 2019.01.12 |
PWC(Paper With Code) - 코드가 있는 논문들을 연도별로 (0) | 2019.01.01 |
표본 추출(Sampling) -> 표본조사(sampling study) (0) | 2018.12.27 |
WBS를 이용한 Day단위 분석 수행관리, 양식 다운로드, WBS를 이용한 Day단위 분석 수행관리시 고려사항 (0) | 2018.12.21 |