CODEDRAGON ㆍDevelopment/Big Data, R, ...
의사결정나무 모형(Decision tree; Tree Models)
· 의사 결정 트리
· 귀납적 추론 , 철학과 심리학 , 논리학에서 아이디어를 얻었습니다.
· 나무 모델(tree model) 중 하나입니다.
· 대표적인 분류분석 기법이며 분류와 예측 모두에서 자주 사용되는 기법입니다.
· 일련의 단순한 의사결정 규칙들을 적용시켜, 큰 집단을 하위 집단으로 나누는 구조입니다. 의사결정 규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법입니다.
· 과거에 수집된 데이터들을 분석하여 이들 사이에 존재하는 패턴(범주별 특성)을 속성의 조합으로 나타내는 분류 모형입니다.
· 의사결정 규칙을 나무(tree)구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류(classification)하거나 예측(prediction)을 수행하는 분석방법입니다.
· 상위노드로부터 하위노드로 나무 구조를 형성하는 매 단계마다 분류변수와 분류기준값의 선택이 중요합니다.
· 상위노드에서의 분류변수와 분류기준값은 이 기준에 의해 분기되는 하위노드에서 노드(집단)내에서는 동질성이, 노드(집단)간에는 이질성이 가장 커지도록 선택됩니다.
· 지니 불순도(Gini Impurity) 또는 정보 이득(Information Gain) 등의 기준을 사용하여 노드를 재귀적으로 분할하면서 나무 모델을 만드는 방법입니다.
'Development > Big Data, R, ...' 카테고리의 다른 글
Financial Times Visual Vocabulary (0) | 2019.09.20 |
---|---|
범주화 방법 - 동일 너비 범주화, 동일 높이 범주화 (0) | 2019.09.16 |
WAYMO Open Dataset (0) | 2019.08.25 |
신경망 모형(NN; Neural network) (0) | 2019.08.19 |
Practical Bayesian optimization of machine learning algorithms (0) | 2019.08.14 |