Machine Learning(21)
-
머신러닝 사례(기계학습 활용)
머신러닝 사례(기계학습 활용) · 가장 많이 사용되는 머신러닝 알고리즘들은 이미 알려진 사례를 바탕으로 일반화된 모델을 만들어 의사 결정 프로세스를 자동화하는 것들입니다. · 기계학습의 이러한 방식은 스팸 메일을 분류하거나, 얼굴을 인식하여 사람을 찾거나, 기상예측, 문자 인식 등의 분야에서 다양하게 활용될 수 있습니다. · 영화 추천에서부터 음식 주문, 쇼핑, 맞춤형 온라인 라디오 방송과 사진에서 친구 얼굴을 찾아주는 일까지 최근 많은 웹사이트와 기기가 머신러닝 알고리즘을 핵심 기술로 채택하고 있습니다. · 페이스북, 아마존, 넷플릭스 같은 복잡한 웹사이트들은 여러 가지 머신러닝 모델을 사용하여 구성 요소의 대부분을 만들어냅니다. · 별을 탐구하고 새로운 행성을 찾기 · 새로운 미립자를 발견 · DNA..
-
QUICK, DRAW 머신러닝 게임, 머신러닝 경험하기
QUICK, DRAW 머신러닝 게임, 머신러닝 경험하기· QUICK, DRAW 머신러닝 게임 페이지· 세계 최대 낙서 데이터 셋· 게임 시작하기
-
세계 최대 낙서 데이터 셋 the world's largest doodling data set
세계 최대 낙서 데이터 셋 the world's largest doodling data set 5천만개 이상의 낙서 그림 데이터셋을 머신러닝연구를 위해 구글은 오픈소스로 공유하고 있습니다. https://quickdraw.withgoogle.com/data 이 중에서 계산기 항목을 선택했습니다. 계산기를 손으로 그린 많은 이미지를 볼 수 있습니다.
-
업 샘플링(up sampling) & 다운 샘플링(down sampling)
업 샘플링(up sampling) & 다운 샘플링(down sampling) 구분 설명 업 샘플링 (up sampling) · 해당 분류에 속하는 데이터가 적은 쪽을 표본으로 더 많이 추출하는 방법입니다. · R: 패키지의 upSample()함수를 통해 업 샘플링 방법을 수행할 수 있습니다. 다운 샘플링 (down sampling) · 해당 분류에 속하는 데이터가 많은 쪽을 적게 추출하는 방법입니다. · R: 패키지의 downSample()함수를 통해 다운샘플링 방법을 수행할 수 있습니다.
-
지니 불순도 곡선
지니 불순도 곡선 · 지니 불순도는 p=0 또는 p=1일 때 0이며 p=1/2일 때 가장 큰 값을 가지는 포물선입니다. · 불순도 함수식과 연관해서 생각해보면 노드에 특정 분류 i만 있거나 특정 분류 i가 전혀 없을 때 I(A)가 작은 값을 가지며, 여러 분류가 섞여 있을 때 큰 값을 갖게 됩니다.
-
홀드아웃 (Holdout) 방법 ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법
홀드아웃 (Holdout) 방법 · ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법 · 주어진 원천 데이터를 랜덤(random)하게 두 분류로 분리하여 교차 검정을 실시하는 방법입니다. 하나는 모형의 학습 및 구축을 위한 훈련용 데이터로 하나는 성과 평가를 위한 검증용 데이터로 사용합니다. · 데이터 집합을 서로 겹치지 않는 훈련 집합(training set)과 시험 집합(test set)으로 무작위 로 구분한 후, 훈련 집합을 이용하여 분석 모형을 구축하고 시험 집합을 이용하여 분석 모형의 성능을 평가하는 기법입니다. (P. Tan, M. Steinbach, and V. Kumar, 2007) · 훈련 집합과 시험 집합의 비율은 50:50, 70:30 등으로..