Development/AI(891)
-
ㄱㄴㄷ워드클라우드
ㄱㄴㄷ워드클라우드 · 한글로 워드 클라우드 이미지를 만들어주는 사이트입니다. · 키워드에는 크게 보여줄 단어를 텍스트에는 함께 포함할 문자열을 입력해 주면 됩니다. http://wordcloud.kr/
-
ML Algorithm - 머신러닝 algorithm 자료
ML Algorithm· 머신러닝 algorithm 자료· 변경된 내용은 아래링크에서 확인하시기 바랍니다. http://bit.ly/2Xk7qAk 직접 다운로드
-
홀드아웃 (Holdout) 방법 ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법
홀드아웃 (Holdout) 방법 · ≒ Holdout Cross Validation; 홀드아웃 교차 검증 ≒ 홀드아웃 교차 방법 · 주어진 원천 데이터를 랜덤(random)하게 두 분류로 분리하여 교차 검정을 실시하는 방법입니다. 하나는 모형의 학습 및 구축을 위한 훈련용 데이터로 하나는 성과 평가를 위한 검증용 데이터로 사용합니다. · 데이터 집합을 서로 겹치지 않는 훈련 집합(training set)과 시험 집합(test set)으로 무작위 로 구분한 후, 훈련 집합을 이용하여 분석 모형을 구축하고 시험 집합을 이용하여 분석 모형의 성능을 평가하는 기법입니다. (P. Tan, M. Steinbach, and V. Kumar, 2007) · 훈련 집합과 시험 집합의 비율은 50:50, 70:30 등으로..
-
Tidy Animated Verbs
Tidy Animated Verbs 데이터를 결합하는 join 방법을 R 애니메이션으로 쉽게 이해할 수 만들어놓은 사이트입니다. 세부적인 사항은 해당 사이트에서 확인하시기 바랍니다. http://bit.ly/2WvvLm2 Mutating Joins Inner Join Left Join Left Join (Extra Rows in y) Right Join Full Join Filtering Joins Semi Join Anti Join Set Operations Union Union All Intersection Set Difference Tidy Data Spread and Gather Mutating Joins Filtering Joins Set Operations ' Tidy Data
-
최빈값(mode), 최빈수
최빈값(mode)· ≒ 최빈수· 데이터에서 가장 자주 나타난 값· 자료 분포 중에서 가장 빈번히 관찰된 최다도수를 갖는 자료값· 자료에서 가장 많이 나타나는 수· 이상치에 의한 영향을 덜 받으며, 데이터 분포가 비대칭인 경우 평균보다 의미가 있습니다.· 최빈값은 table()함수을 사용해 각 데이터가 출현한 횟수를 센 분할표(Contingency Table)를 만들고, which.max()함수를 사용해 최대 빈도가 저장된 색인을 찾는 방법으로 구할 수 있습니다.
-
Apriori 알고리즘 연관 분석절차
Apriori 알고리즘 연관 분석절차