ML(102)
-
Gapminder World - Wealth & Health of Nations
Gapminder World - Wealth & Health of Nations 한스 로슬링(Hans Rosling)교수의 그래픽 애니메이션으로 국가별 기대수명와 GDP를 시각화한 사이트입니다. http://bit.ly/2qH8gc4 http://bit.ly/2OFolZv
-
SAS(Statistical Analysis System)
SAS(Statistical Analysis System) · 미국 노스캐롤라이나 주립 대학교에서 1967년 원형이 개발되고 SAS Institute사에서 기능을 확장한, 통계 해석을 중심으로 한 통계분석 소프트웨어 제품군입니다. · 비즈니스 인텔리전스, 데이터 관리 및 예측분석과 관련한 제품군을 SAS연구소에서 개발하였습니다. · 2002년에는 텍스트 마이너 소프트웨어를 개발하였고, 2010년에는 소셜 미디어 분석, 소셜 미디어 모니터링, 참여와 심리 분석을 위한 도구 등을 개발하였습니다. http://bit.ly/2FjrJJV https://www.sas.com/ko_kr/home.html
-
텍스트 데이터 vs 시각화된 데이터
텍스트 데이터 vs 시각화된 데이터 텍스트로만 구성된 데이터와 이미지로 구성된 데이터 중 어느 것이 더 직관적인지 바로 확인할 수 있습니다.
-
Dropout: A Simple Way to Prevent Neural Networks from Overfitting
Dropout: A Simple Way to Prevent Neural Networks from Overfitting https://bit.ly/2FV7iA8 직접 다운로드
-
Overfitting 해결방법, 훈련 데이터양을 통한 Overfitting 해결시의 문제점
Overfitting 해결방법 Overfitting의 문제를 피하기 위한, 가장 확실한 대책 중 하나는 훈련 데이터(Training data)의 양을 늘리는 것이다. 훈련 데이터양을 통한 Overfitting 해결시의 문제점 · 훈련 데이터는 아무런 대가 없이 그냥 얻어지는 것이 아닙니다. · 양질의 훈련 데이터를 얻으려면 많은 시간과 비용을 필요로 합니다. · 어떤 경우는 추가 데이터의 확보가 어렵거나 불가능한 경우도 있다. · 학습 데이터의 양이 많아지면 결과적으로 학습에 걸리는 시간이 늘어나는 문제도 발생합니다.
-
일반화 방법 - 속성 줄이기(Attribute Reduction)
속성 줄이기(Attribute Reduction) 오컴의 면도날(Occam’s Razor) 방법으로 "같은 현상을 설명하는 두 개의 이론이 있다면 간단한 쪽을 선택하라"는 의미입니다. Model B와 Model C 중 어느 것을 택할 것인가 선택의 상황이 있을 때 흔히 적용되는 방법입니다. 오캄의 원리에 의해서 주어진 점들을 추정 Model B를 선택하게 됩니다. 복잡성이 너무 높은 경우 과적합이 될 확률이 높습니다. (Model B보다 Model C가 과적합이 될 확률이 높습니다.) 결과에 크게 영향을 주지 않는 속성을 제거합니다. (Model C에서 결과에 영향을 주지 않는 값을 제거하여 Model B와 같이 좀 더 단순한 모델로 만들어줍니다.)