Development/Big Data, R, ...(885)
-
통계학 분야의 알고리즘
통계학 분야의 알고리즘 통계학 분야에서는 카트(CART), 체이드(CHAID) 알고리즘이 개발되었습니다.
-
의사결정나무 분석 알고리즘
의사결정나무 분석 알고리즘 의사결정나무 분석에는 인공지능, 기계학습 분야에서 개발된 ID3, C4.5, C4.8 C5.0 알고리즘들과 통계학 분야에서 개발된 카트(CART), 체이드(CHAID) 알고리즘으로 나눌 수 있습니다.
-
신뢰도 vs 타당도
신뢰도 vs 타당도 신뢰도 타당도 · conviction · reliability · Validity · 어떻게 측정하느냐의 문제 · 무엇을 측정하느냐의 문제 · 얼마나 일관성 있게 측정하는지 검토 · 얼마나 정확하게 추정하고 있는지 검토 · 몸무게 측정했을 때 48kg였는데, 지금은 왜 52kg이지? · 저울을 믿을 수 있나? 측정방식/방법이 무엇이지? · 몸무게를 측정하려고 할때, · 줄자로 측정할 것인가? 저울을 사용할 것인가?
-
의사결정나무분석 활용
의사결정나무분석 활용 의사결정나무분석은 다양한 분야에서 활용되고 있습니다. · 시장조사 · 광고조사 · 의학연구 · 품질관리 · 고객 타겟팅 · 고객들의 신용점수화 · 캠페인 반응분석 · 고객 행동예측 · 고객 세분화 · 사건사고 발생 예측 · 질병 발생 규칙 · 등
-
의사결정나무 분류
의사결정나무 분류의사결정나무는 목표변수가 이산형인 경우와 연속형인 경우로 구분됩니다.
-
가지치기(Pruning)
가지치기(Pruning) 끝마디가 너무 많으면 모형이 과대 적합된 상태로 현실문제에 적용할 수 있는 적절한 규칙이 나오지 않게됩니다. 따라서 분류된 관측치의 비율 또는 MSE(Mean Squared Error)등을 고려한 수준의 가지치기 규칙을 제공해야 합니다. 즉, overfitting을 막아주어야 합니다.