CODEDRAGON ㆍDevelopment/Big Data, R, ...
상관계수(Correlation Coefficient)
· 두 변수 간 관련성의 정도를 나타내주는 값을 의미합니다.
· 두 변수 간 상관관계의 크기를 나타내주는 값을 의미합니다.
· 산점도의 점들의 분포를 통해 일정한 패턴을 확인한 후, 상관계수를 구해 두 변수간의 선형관계의 정도를 알아내는 것입니다.
· 변수 간 높은 상관 계수가 존재한다는 것은 두 변수가 같이 커지거나 작아지는 경향이 있다는 의미입니다.
· 상관계수는 알파벳 'r' 또는 σ 로 표기합니다.
· 변수들 간의 상관도가 높아질수록↑ 상관계수 r값이 커집니다↑.
상관계수 값
· 상관계수는 -1≤r≤1 범위로 표시됩니다.
· 상관계수는 양수(+) 또는 음수(-)의 형태를 가집니다. 즉, 변수의 관련성에 따라 양의 상관, 음의 상관, 무상관의 형태를 가집니다.
· 값이 크면 좋은것으로 회귀식이 속성과 목적변수간 관계를 잘 설명하는지 정량적으로 표현됩니다.
· 값이 작으면 나쁜것으로 회귀식이 속성과 목적변수간 관계를 잘 설명하지 못한다는 것을 정량적으로 표현됩니다.
두 변수의 관련성 |
상관계수 값(r) |
두 변수의 관련성이 클수록↑ |
상관계수는 1에 가까워집니다. |
두 변수의 관련성이 적을 수록↓ |
상관계수는 0에 가까워집니다. |
'Development > Big Data, R, ...' 카테고리의 다른 글
요구사항 분석 절차, 요구사항 분석 절차 도식도(다이어그램) (0) | 2019.11.22 |
---|---|
명목형 데이터, 명목형 데이터 예 (0) | 2019.11.21 |
의사결정나무 수행 단계 (0) | 2019.11.19 |
의사결정나무 구조 (0) | 2019.11.18 |
기계학습 방법(알고리즘 분류) (0) | 2019.11.18 |