CODEDRAGON ㆍDevelopment/Big Data, R, ...
데이터과학 입문
Doing Data Science
http://www.yes24.com/24/goods/14982043?scode=032&OzSrank=1
http://shop.oreilly.com/product/0636920028529.do#
http://www.amazon.com/Doing-Data-Science-Straight-Frontline/dp/1449358659
목차
CHAPTER 1 소개: 데이터과학이란 무엇인가?
__1.1 빅데이터와 데이터과학 열풍
__1.2 열풍을 넘어서
__1.3 왜 지금?
__1.4 현재의 풍경(약간의 역사와 함께)
__1.5 데이터과학 프로필
__1.6 사고 실험: 메타 정의
__1.7 데이터과학자는 정말로 어떤 직업인가?
CHAPTER 2 통계적 추론, 탐색적 데이터분석과 데이터과학 과정
__2.1 빅데이터 시대의 통계적 사고
__2.2 탐색적 데이터분석
__2.3 데이터과학 과정
__2.4 사고 실험: 여러분은 혼돈을 어떻게 시뮬레이션할 것인가?
__2.5 사례 연구: 리얼다이렉트
CHAPTER 3 알고리즘
__3.1 기계학습 알고리즘
__3.2 세 가지 기본 알고리즘
__3.3 연습문제: 기본적인 기계학습 알고리즘들
__3.4 전체 요약
__3.5 사고 실험: 통계로봇
CHAPTER 4 스팸 필터, 나이브베이즈, 경합
__4.1 사고 실험: 예제로 배우기
__4.2 나이브베이즈
__4.3 좀 더 멋있게: 라플라스 평활
__4.4 나이브베이즈와 k-NN의 비교
__4.5 코드 예시
__4.6 웹스크래핑: 기사분류를 위한 나이브베이즈
CHAPTER 5 로지스틱 회귀
__5.1 사고 실험
__5.2 분류기
__5.3 M6D 로지스틱 회귀 사례연구
__5.4 Media 6 Degrees 연습문제
CHAPTER 6 시간기록과 금융 모형화
__6.1 카일 티그와 티비태그
__6.2 시간기록
__6.3 캐시 오닐
__6.4 사고 실험
__6.5 금융 모형화
__6.6 연습문제: 티비태그와 시간기록 사건 데이터
CHAPTER 7 데이터에서 의미 추출하기
__7.1 윌리엄 커키어스키
__7.2 캐글모형
__7.3 사고 실험: 로봇 평가자의 윤리적 함축성은 무엇인가?
__7.4 특징 선택
__7.5 데이비드 허페이커: 사회연구에 대한 구글의 하이브리드 접근법
CHAPTER 8 추천 엔진: 대규모 사용자 대면 데이터 상품
__8.1 현실 세계의 추천 엔진
__8.2 사고 실험: 필터 버블
__8.3 연습문제: 추천 시스템 만들기
CHAPTER 9 데이터 시각화와 사기 탐지
__9.1 데이터 시각화의 역사
__9.2 다시 한 번, 데이터과학이란 무엇인가?
__9.3 데이터 시각화 프로젝트의 사례
__9.4 마크의 데이터 시각화 프로젝트
__9.5 데이터과학과 위험
__9.6 스퀘어 사의 데이터 시각화
__9.7 이언의 사고 실험
__9.8 참고사항
CHAPTER 10 소셜네트워크와 데이터 저널리즘
__10.1 모닝사이드 애널리틱스에서의 소셜네트워크 분석
__10.2 소셜네트워크 분석
__10.3 소셜네트워크의 용어들
__10.4 사고 실험
__10.5 모닝사이드 애널리틱스
__10.6 통계적 관점으로 본 소셜네트워크 분석의 배경
__10.7 데이터 저널리즘
CHAPTER 11 인과성
__11.1 상관은 인과관계를 함축하지는 않는다
__11.2 OK 큐피트의 시도
__11.3 황금 기준: 확률적 임상실험
__11.4 A/B 검정
__11.5 차선책: 관찰적 연구
__11.6 세 가지의 조언
CHAPTER 12 역학
__12.1 매디건의 배경
__12.2 사고 실험
__12.3 현대 학술 통계학
__12.4 의학 문헌과 관찰 연구
__12.5 계층화는 교란변수 문제를 해결하지 않는다
__12.6 더 나은 방법은 없을까?
__12.7 연구 실험
__12.8 사고 실험을 마치며
CHAPTER 13 데이터경진대회의 교훈: 데이터 누출과 모형 평가
__13.1 클라우디아의 데이터과학자 프로필
__13.2 데이터마이닝 경진대회
__13.3 좋은 모형 개발자가 되는 방법
__13.4 데이터 누출
__13.5 누출을 피하는 방법
__13.6 모형 평가하기
__13.7 알고리즘 선택
__13.8 마지막 예
__13.9 사고를 나누기
CHAPTER 14 데이터엔지니어링: 맵리듀스, 프리젤, 하둡
__14.1 데이비드 크로셔에 대해
__14.2 사고 실험
__14.3 맵리듀스
__14.4 단어빈도수 문제
__14.5 맵리듀스의 다른 예
__14.6 프리젤
__14.7 조시 윌스에 대해
__14.8 사고 실험
__14.9 데이터과학자가 된다는 것
__14.10 경제성 살펴보기: 하둡
__14.11 다시 조시에게: 워크플로
__14.12 하둡을 시작하려면?
CHAPTER 15 수업에 대한 학생들의 소감
__15.1 과정적 사고
__15.2 더 이상 순진하지 않다
__15.3 도와주기
__15.4 여러분의 마일리지는 다를 수 있다
__15.5 다리와 터널을 잇는 길들
__15.6 우리 작업의 일부
CHAPTER 16 차세대 데이터과학자, 교만, 그리고 윤리
__16.1 지금까지 무엇을 학습했는가?
__16.2 다시 한 번, 데이터과학이란 무엇인가?
__16.3 차세대 데이터과학자란?
__16.4 윤리적인 데이터과학자 되기
__16.5 경력에 관한 조언
'Development > Big Data, R, ...' 카테고리의 다른 글
고려대학교 통계연구소 (0) | 2015.09.12 |
---|---|
UC Irvine Machine Learning Repository – 데이터 모음 (0) | 2015.09.07 |
R을 이용한 데이터 분석 실무 (0) | 2015.08.27 |
R 함수 사용법 확인방법 (0) | 2015.08.22 |
CSV(Comma Separated Values)-텍스트 데이터 (0) | 2015.08.16 |