하둡(Hadoop)
CODEDRAGON ㆍDevelopment/AI
반응형
하둡(Hadoop)
· 2006년 더그 커팅(Doug Cutting)과 마이크 캐퍼렐라(Mike Cafarella)가 개발하였습니다.
· 대량의 자료를 처리할 수 있는 컴퓨터 클러스터의 분산 응용 프로그램을 지원하는 자바 소프트웨어 프레임워크입니다. 즉, 대용량 분산 저장과 처리를 위한 프레임워크입니다.
· 하둡은 오픈소스 프로젝트로 많은 벤더들이 새 기능을 추가하거나 코드 기반을 개선하는 방식으로 독자적인 배포판을 개발해 공급하고 있습니다.
· 크게 빅데이터를 저장하는 분산파일시스템인 HDFS과 분산병렬을 처리하는 맵리듀스(MapReduce)로 구성됩니다.
· 하둡의 이름은 더그커팅의 아들이 가지고 놀던 노란색 코끼리 인형에서 유래했습니다. 그래서 하둡 기술의 이름은 코기리와 관련 있는 이름으로 지어지고 있습니다. (Mahout, Oozie, Horton등)
Doug Cutting (더그 커팅)
http://codedragon.tistory.com/7577
'Development > AI' 카테고리의 다른 글
클라우드 컴퓨팅 개념도 - 클라이언트 디바이스, 클라우드 컴퓨팅 플랫폼, 클라우드 서비스, 클라우드 (0) | 2016.12.09 |
---|---|
하둡(Hadoop) 배포판의 기본 구성 요소 (0) | 2016.12.02 |
스마트 데이터의 3A 특성 - 정확성(Accurate), 행동성(Actionable), 민첩성(Agile) (0) | 2016.11.15 |
빅데이터 에코시스템 (0) | 2016.11.02 |
스칼라(Scalar) vs 벡터(Vector) (0) | 2016.10.28 |