Development/Big Data, R, ...(885)
-
은전한닢 프로젝트 - 오픈소스 한국어 형태소 분석기
은전한닢 프로젝트오픈소스 한국어 형태소 분석기 http://eunjeon.blogspot.com/ https://bitbucket.org/eunjeon/mecab-kohttps://bitbucket.org/eunjeon/mecab-ko-dic https://docs.google.com/spreadsheets/d/1-9blXKjtjeKZqsf4NzHeYJCrr49-nXeRF6D80udfcwY/edit#gid=589544265
-
하이브(Hive)
하이브(Hive) · 클라우데라에서 개발하였습니다. · SQL-like HiveQL을 사용하여 하둡을 SQL과 같은 쿼리언어로 사용하게 해줍니다. · HiveQL을 작성하여 하이브 컴파일러를 통해 맵리듀스 작업을 생성하게 됩니다. · 하둡의 최상위층에 있는 데이터 웨어하우징 패키지로 다수의 사용자 및 대용량 로그 데이터 처리를 위해 페이스북에서 개발한 정보 플랫폼 중 가장 중요한 구성 요소입니다. · 페이스북등 소셜네트워킹에서 매일같이 생산되는 대량의 데이터를 관리하고 학습하기 위해 개발되었습니다. · 페이스북은 하둡 분산파일시스템에 대량의 데이터를 저장해 두고 하이브가 제공하는 믿을만한 SQL 기법을 이용하여 데이터를 분석합니다. · 하이브는 많은 조직들이 일반적인 목적의 확장 가능한 데이터 처리 플랫..
-
stringr 패키지 설치하기 & stringr 패키지 임포트
stringr 패키지 설치하기 > library(stringr) >
-
Apache Spark(아파치 스파크)
Apache Spark · 아파치 스파크 · Cluster Computing with Working Sets · UC 버클리의 AMPlab에서 만든 경량 오픈 소스 분산처리 프레임워크입니다. · 하둡의 MapReduce를 대체할 수 있는 분산처리 프레임워크입니다. · 단순 맵리듀스외에 SQL/스트리밍/머신러닝이 묶인 구조입니다. · 메모리를 최대로 활용해 반복작업에 높은 효율을 보입니다. (하둡은 디스크 기반입니다.) · 스칼라(Scala)언어로 되어 있습니다. https://en.wikipedia.org/wiki/Apache_Spark https://spark.apache.org/ Spark의 언어지원 · 스칼라(Scala)언어를 기반으로 되어 있습니다. · 자바, 파이썬도 지원합니다. · Spark ..
-
하둡 1.x vs 하둡 2.x
하둡 1.x vs 하둡 2.x
-
McKinsey, Big data: The next frontier for innovation, competition, and productivity
McKinsey, Big data: The next frontier for innovation, competition, and productivityhttps://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation 직접 다운로드