Development/Big Data, R, ...(885)
-
모형 평가
모형 평가 · ≒ 모델 성능 평가 · ≒ 모델 평가 ≒ 모델 평가 검증 · ≒ 모델링 성능 평가 · 분석 모형의 적합성 판단 및 조정을 합니다. · 학습∙검증 데이터 결과를 비교 및 최적화합니다. · 예측분석에서 예측모델의 성능을 평가합니다. 머신러닝 알고리즘 어떠한 데이터를 이용해서, 어떠한 문제를 풀 때 정확한 결과를 얻는 것이 아니라 알고리즘에 의해 데이터를 분류와 예측을 수행하는 알고리즘입니다. 모델 평가 ≒ 모형 평가 머신러닝 알고리즘에 의한 결과가 좋은지를 판단하는 것이 모델 평가입니다.
-
요구사항 분석 절차, 요구사항 분석 절차 도식도(다이어그램)
요구사항 분석 절차 · 빅데이터 저장 모델 설계를 위한 요구사항 분석 절차는 정보 시스템을 신규로 개발하거나 기존 시스템을 개선하는 데 필요한 데이터 요구사항을 수집하여 분석하는 일반적인 절차 에서 크게 벗어나지 않습니다. 기본적으로 요구사항을 수집하고, 이를 분석하여 명세하고 검증을 통해 확정하는 4단계로 이루어집니다. · 요구사항 분석 단계에서 이전 단계에서 수집된 요구사항을 분석하되, 미비한 부분이 있으면 추가로 수집합니다. · 요구사항 명세 단계에서도 요구사항 분석결과를 상세화하고 이를 바탕으로 명세서를 작성하나, 이전 단계에서 수집이 추가로 필요하거나 구체적인 분석이 미비한 경우 추가로 요구사항 수집과 분석을 수행할 수 있습니다. · 요구사항 검증단계에서도 검증상 미비한 점이 발생하면 마찬가지로..
-
명목형 데이터, 명목형 데이터 예
명목형 데이터가능한 값이 제한되어 있고 종종 고정되어 있는 변수를 의미합니다. 명목형 데이터 예 · yes/no, 양성/음성, 합격/불합격, · 성별, · 상/중/하, · 등급, · 국가명, · 혈액형, · 등
-
상관계수(Correlation Coefficient), 상관계수 값 해석
상관계수(Correlation Coefficient) · 두 변수 간 관련성의 정도를 나타내주는 값을 의미합니다. · 두 변수 간 상관관계의 크기를 나타내주는 값을 의미합니다. · 산점도의 점들의 분포를 통해 일정한 패턴을 확인한 후, 상관계수를 구해 두 변수간의 선형관계의 정도를 알아내는 것입니다. · 변수 간 높은 상관 계수가 존재한다는 것은 두 변수가 같이 커지거나 작아지는 경향이 있다는 의미입니다. · 상관계수는 알파벳 'r' 또는 σ 로 표기합니다. · 변수들 간의 상관도가 높아질수록↑ 상관계수 r값이 커집니다↑. 상관계수 값 · 상관계수는 -1≤r≤1 범위로 표시됩니다. · 상관계수는 양수(+) 또는 음수(-)의 형태를 가집니다. 즉, 변수의 관련성에 따라 양의 상관, 음의 상관, 무상관의 형..
-
의사결정나무 수행 단계
의사결정나무 수행 단계
-
의사결정나무 구조
의사결정나무 구조 · 의사 결정 나무는 각 노드마다 질문을 던지고 그 응답에 따라 가지를 쳐서 데이터를 분리합니다. · 데이터가 얼마나 잘 분리되었는지는 불순도(impurity)라는 기준으로 평가하며, 가장 좋은 질문은 한 노드의 데이터를 두 개의 자식 노드로 분리했을 때 자식 노드들의 불순도가 가장 낮아지는 질문입니다.