Machine Learning(21)
-
State of Machine Learning and Data Science 2020 - kaggle
State of Machine Learning and Data Science 2020 - kaggle https://www.kaggle.com/kaggle-survey-2020 Gender Age Country Education Programming Experience Machine Learning Experience Pay Interactive Development Environments; IDE Methods & Algorithms frameworks cloud usage database usage 직접 다운로드 or https://bit.ly/32z66OL
-
MAPE(Mean absolute percentage error)
MAPE(Mean absolute percentage error) · ≒ 평균 절대 백분율 오차 · ≒ 평균 절대 백분 오차 비율 · 정확도를 오차의 백분율로 표시됩니다. · MAPE는 백분율이기 때문에 다른 정확도 측도 통계량보다 더 쉽게 이해할 수 있습니다. · 예를 들어 MAPE가 5이면 예측 값은 평균 5% 벗어납니다. https://en.wikipedia.org/wiki/Mean_absolute_percentage_error
-
행렬(Matrix)
행렬(Matrix) · 행렬은 행(row)과 열(column)에 수를 배열하여 직4각형을 이루게 한 수의 집합을 말합니다. · 각 수들을 행렬의 원소 또는 성분이라고 말하며, 행렬은 수학의 여러 분야에서는 물론 공학·물리학·경제학·통계학 등에서 널리 응용되고 있습니다. · 역사적으로 처음에는 행렬이 아니라 행렬식 이라는 정방행렬과 연관된 수 값이 인식되었다가 점차 대수적인 것으로 행렬의 개념이 나타나게 되었고, 19세기 영국의 수학자 아서 케일리(Arthur Cayley)는 행렬이라는 용어를 도입하고 행렬의 대수적 개념을 발달시켰습니다. · 벡터와 마찬가지로 행렬에는 한 가지 유형의 스칼라만 저장할 수 있다. 따라서 모든 요소가 숫자인 행렬은 가능하지만, ‘1열은 숫자, 2열은 문자열’과 같은 형태는 불..
-
The Measurement of Observer Agreement for Categorical Data
The Measurement of Observer Agreement for Categorical Data 직접 다운로드 or https://bit.ly/2rQXZOp
-
k평균 클러스터링의 수행절차(과정)
k평균 클러스터링의 수행절차(과정) 단계 설명 1 Step 클러스터링의 수 k 값를 정의 · 초기 (군집의) 중심으로 k개의 객체를 임의로 선택합니다. 2 Step 각 측정값을 클러스터에 할당 · 각 자료를 가장 가까운 군집 중심에 할당합니다. · 데이터가 분포된 공간상에 '클러스터 중심'으로 가정할 임의의 지점 k개를 선택합니다. 각 데이터는 근처에 있는 '클러스터 중심'에 할당됩니다. 3 Step 새로운 클러스터의 중심 계산 · 각 군집 내의 자료들의 평균을 계산하여 군집의 중심을 갱신(update)합니다. · 각 '클러스터 중심'을 해당 클러스터에 속한 데이터들이 평균으로 조정합니다. 4 Step 클러스터 재분류 · 군집 중심의 변화가 거의 없을 때(또는 최대 반복수)까지 단계2와 단계3를 반복합니..
-
가지치기 기준
가지치기 기준 가지치기는 테스트 데이터를 활용하는 방법과 전문가가 직접하는 두가지 방법이 있습니다. 방법 설명 테스트 데이터 활용 방법 · 구축된 모형에 테스트 데이터를 적용하는 방법입니다. · 테스트 데이터를 통해 도출된 모형의 예측률을 검토합니다. · 분류가 잘못될 위험이 높거나 부적절한 추론규칙을 가지고 있는 가지를 제거합니다. 전문가에 의한 방법 · 특정 분야의 전문가가 구축된 모형에서 제시되고 있는 규칙들의 타당성 검토를 수행합니다. · 타당성이 없는 규칙을 제거합니다.