다중 공선성(multicollinarity)
CODEDRAGON ㆍDevelopment/Big Data, R, ...
반응형
다중 공선성(multicollinarity)
· 다중 공선성은 회귀 모델에서 변수 간의 상관관계가 커서 한 변수를 다른 변수들의 선형 조합으로 손쉽게 예측할 수 있는 경우를 뜻합니다.
· 다중공선성은 회귀계수의 분산을 증가시킵니다.
· 다중 공선성이 존재하면 회귀모델 계수 β0, β1, β2, …, βp의 추정이 어려워집니다.
다중 공선성 예
Xi1 = aXi2 + bXi3이 성립한다면 선형 회귀 식에서 Xi1 변수의 사용이 무의미해지기 때문입니다.
https://en.wikipedia.org/wiki/Multicollinearity
'Development > Big Data, R, ...' 카테고리의 다른 글
값이 누락된 데이터 처리 (0) | 2020.01.30 |
---|---|
데이터 교정 (0) | 2020.01.29 |
F1지표(F1 score) 예시 2 (0) | 2020.01.29 |
기존 프로그래밍 vs 머신러닝 (0) | 2020.01.29 |
배열의 산술연산자 (.+, .-, .*, ./, .\, .^) (0) | 2020.01.28 |