Development/Big Data, R, ...(885)
-
그라디언트부스트(Gradient Boost)
그라디언트부스트(Gradient Boost) · ≒ 그라디언트부스팅(Gradient Boosting) · 아다부스트처럼 앙상블에 이전까지의 오차를 보정하도록 예측기를 순차적으로 추가합니다. 하지만 아다부스트처럼 반복마다 샘플의 가중치를 수정하는 대신 이전 예측기가 만든 잔여오차(Residual error)에 새로운 예측기를 학습시킵니다. · 랜덤포레스트와 달리 이진 트리의 오차를 보완하는 방식으로 순차적으로 트리를 만듭니다. · 그래디언트 부스트는 회귀와 분류에 모두 사용할 수 있습니다. · 그래디언트 부스트는 회귀문에도 잘 동작하며 이를 그래디언트 트리 부스팅(Gradient Tree Boostring) 또는 그래디언트 부스티드 회귀트리(GBRT; Gradient Bossted Regression Tr..
-
Google Dataset Search
Google Dataset Search 구글에서 데이터셋 검색도 가능합니다. https://toolbox.google.com/datasetsearch "titanic" 검색 결과 https://toolbox.google.com/datasetsearch/search?query=titanic&docid=Ae0xzZhxmAZ4JSIRAAAAAA%3D%3D "blockchain" 검색 결과 https://toolbox.google.com/datasetsearch/search?query=blockchain&docid=pYk3YerN9I4Pn59PAAAAAA%3D%3D
-
O'Reilly Data Newsletter
O'Reilly Data Newsletter Data 뉴스레터를 받아볼 수 있습니다. https://www.oreilly.com/data/newsletter.html https://www.oreilly.com/topics/data
-
Becoming a data scientist podcast
Becoming a data scientist podcast 데이터 사이언티스트 되기 팟캐스트 https://www.becomingadatascientist.com/ https://www.becomingadatascientist.com/category/podcast/ https://www.youtube.com/channel/UCfxnrdBM1YRV9j2MB8aiy4Q
-
DACON(데이콘)
DACON· ≒ 데이콘· Kaggle(캐글)과 유사한 서비스· 한국에서 만든 데이터 분석 대회 플랫폼http://codedragon.tistory.com/965 http://dacon.io/
-
rpython - container 실행, 정상 동작 확인
rpython - container 실행홈 디렉터리는 c:\Users\[사용자명]이 됩니다. 구분 설명 docker run 도커 컨테이너를 최초로 실행하는 명령이다. -Pit 컨테이너에서 사용하는 모든 네트워크 포트(port)를 외부로 개방하고 셸을 사용하기 위한 옵션입니다. --name rpython datascienceschool/rpython 이미지를 rpython이란 컨테이너 이름으로 가동합니다. -p 호스트포트:컨테이너내부포트 컨테이너 내부의 포트를 호스트 컴퓨터로 열어줍니다. 포트는 일단 run 명령을 실행할 때만 열 수 있으므로 앞으로 사용할 포트는 미리 열어주어야 한다. 8888, 8787, 6006, 5000 포트는 같은 포트 번호로 오픈합니다. 22 포트는 8022 로 변경하여 오픈합니..