분류 전체보기(14736)
-
신뢰도 vs 타당도
신뢰도 vs 타당도 신뢰도 타당도 · conviction · reliability · Validity · 어떻게 측정하느냐의 문제 · 무엇을 측정하느냐의 문제 · 얼마나 일관성 있게 측정하는지 검토 · 얼마나 정확하게 추정하고 있는지 검토 · 몸무게 측정했을 때 48kg였는데, 지금은 왜 52kg이지? · 저울을 믿을 수 있나? 측정방식/방법이 무엇이지? · 몸무게를 측정하려고 할때, · 줄자로 측정할 것인가? 저울을 사용할 것인가?
-
의사결정나무분석 활용
의사결정나무분석 활용 의사결정나무분석은 다양한 분야에서 활용되고 있습니다. · 시장조사 · 광고조사 · 의학연구 · 품질관리 · 고객 타겟팅 · 고객들의 신용점수화 · 캠페인 반응분석 · 고객 행동예측 · 고객 세분화 · 사건사고 발생 예측 · 질병 발생 규칙 · 등
-
의사결정나무 분류
의사결정나무 분류의사결정나무는 목표변수가 이산형인 경우와 연속형인 경우로 구분됩니다.
-
가지치기(Pruning)
가지치기(Pruning) 끝마디가 너무 많으면 모형이 과대 적합된 상태로 현실문제에 적용할 수 있는 적절한 규칙이 나오지 않게됩니다. 따라서 분류된 관측치의 비율 또는 MSE(Mean Squared Error)등을 고려한 수준의 가지치기 규칙을 제공해야 합니다. 즉, overfitting을 막아주어야 합니다.
-
지니 불순도 곡선
지니 불순도 곡선 · 지니 불순도는 p=0 또는 p=1일 때 0이며 p=1/2일 때 가장 큰 값을 가지는 포물선입니다. · 불순도 함수식과 연관해서 생각해보면 노드에 특정 분류 i만 있거나 특정 분류 i가 전혀 없을 때 I(A)가 작은 값을 가지며, 여러 분류가 섞여 있을 때 큰 값을 갖게 됩니다.
-
반복적 분리 과정
반복적 분리 과정 · 모든 공간을 직사각형으로 나누어서 각 직사각형이 가능한 한 '순수(Pure)'하게 동질적(Homogenous)이 되도록 하는 과정입니다. · 최종 직사각형에 포함된 변수가 모두 동일한 집단에 속하게 됩니다. 반복적 분리 과정을 통해 각 영역에는 순수한 데이터로만 분류되어 졌습니다. 반복적 분리 순서 단계 설명 1 변수 중 하나인 xi가 선택되고 xi의 값 즉, si(분할기준)가 p차원의 공간을 두 개의 부분으로 나누도록 선정합니다. 2 다시 변수를 선정해서 같은 방식으로 나눕니다. 3 원하는 순수도에 도달할 때까지 반복 수행합니다.