머신러닝(28)
-
QUICK, DRAW 머신러닝 게임, 머신러닝 경험하기
QUICK, DRAW 머신러닝 게임, 머신러닝 경험하기· QUICK, DRAW 머신러닝 게임 페이지· 세계 최대 낙서 데이터 셋· 게임 시작하기
-
세계 최대 낙서 데이터 셋 the world's largest doodling data set
세계 최대 낙서 데이터 셋 the world's largest doodling data set 5천만개 이상의 낙서 그림 데이터셋을 머신러닝연구를 위해 구글은 오픈소스로 공유하고 있습니다. https://quickdraw.withgoogle.com/data 이 중에서 계산기 항목을 선택했습니다. 계산기를 손으로 그린 많은 이미지를 볼 수 있습니다.
-
업 샘플링(up sampling) & 다운 샘플링(down sampling)
업 샘플링(up sampling) & 다운 샘플링(down sampling) 구분 설명 업 샘플링 (up sampling) · 해당 분류에 속하는 데이터가 적은 쪽을 표본으로 더 많이 추출하는 방법입니다. · R: 패키지의 upSample()함수를 통해 업 샘플링 방법을 수행할 수 있습니다. 다운 샘플링 (down sampling) · 해당 분류에 속하는 데이터가 많은 쪽을 적게 추출하는 방법입니다. · R: 패키지의 downSample()함수를 통해 다운샘플링 방법을 수행할 수 있습니다.
-
지니 불순도 곡선
지니 불순도 곡선 · 지니 불순도는 p=0 또는 p=1일 때 0이며 p=1/2일 때 가장 큰 값을 가지는 포물선입니다. · 불순도 함수식과 연관해서 생각해보면 노드에 특정 분류 i만 있거나 특정 분류 i가 전혀 없을 때 I(A)가 작은 값을 가지며, 여러 분류가 섞여 있을 때 큰 값을 갖게 됩니다.
-
Penn Treebank Tagset(펜 트리뱅크 태그세트)의 사용 품사
Penn Treebank Tagset(펜 트리뱅크 태그세트)의 사용 품사 Alphabetical list of part-of-speech tags used in the Penn Treebank Project Number Tag Description 1. CC Coordinating conjunction 2. CD Cardinal number 서수 3. DT Determiner 관형사 4. EX Existential there 5. FW Foreign word 6. IN Preposition or subordinating conjunction 7. JJ Adjective 8. JJR Adjective, comparative 9. JJS Adjective, superlative 10. LS List item..
-
홀드아웃 (Holdout) 방법 ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법
홀드아웃 (Holdout) 방법 · ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법 · 주어진 원천 데이터를 랜덤(random)하게 두 분류로 분리하여 교차 검정을 실시하는 방법입니다. 하나는 모형의 학습 및 구축을 위한 훈련용 데이터로 하나는 성과 평가를 위한 검증용 데이터로 사용합니다. · 데이터 집합을 서로 겹치지 않는 훈련 집합(training set)과 시험 집합(test set)으로 무작위 로 구분한 후, 훈련 집합을 이용하여 분석 모형을 구축하고 시험 집합을 이용하여 분석 모형의 성능을 평가하는 기법입니다. (P. Tan, M. Steinbach, and V. Kumar, 2007) · 훈련 집합과 시험 집합의 비율은 50:50, 70:30 등으로..