분류 전체보기(14729)
-
Apache Mahout(아파치 머하웃)
Apache Mahout(아파치 머하웃) · 대용량 데이터를 처리하는 분산처리가 가능하고 확장성을 가진(scalable) 기계학습용 오픈 소스 라이브러리입니다. · Apache project to produce free implementations of distributed or otherwise scalable machine learning algorithms · Classification, clustering, and collaborative filtering, frequent itemset mining · 맵리듀스를 이용하는 아파치 하둡위에 적용되며 비슷한 특성을 가진 데이터들을 분류하고 정의하는 작업 및 협업 필터링(collaborative filtering)을 수행합니다. https://en.w..
-
KNIME
KNIME · Konstanz Information Miner · modular data pipelining concept https://www.knime.com/
-
MOA (Massive Online Analysis)
MOA (Massive Online Analysis) · Closely related project to the WEKA project · Open source framework for data stream mining https://moa.cms.waikato.ac.nz/ https://github.com/waikato/moa
-
3.Summary - 3.빅데이터 수집·변환 모듈 개발하기
내·외부 데이터의 수집 방법
-
IRIS 데이터 셋
IRIS 데이터 셋 · IRIS 데이터 셋은 우리나라에서 붓꽃(IRIS)으로 해석되는 데이터입니다. · 아이리스는 통계학자인 피셔(Fisher) 가 공개한 데이터입니다. · 머신러닝과 통계 분야에서 오래전부터 사용해온 데이터 셋입니다. · 붓꽃들은 Iris setosa(세토사), Iris virginica(버지니카), Iris versicolor(베르시칼라) 세 가지 종류가 있으며 이 붓꽃을 분류한 데이터입니다. · 붓꽃들은 꽃받침과 꽃잎의 비율로 품종을 구분하기 때문에 연구 끝에 꽃잎의 각 부분의 너비와 길이 등을 측정하여 데이터로 만들었으며 150개의 레코드로 구성되어 있습니다. · 붓꽃에 따라 꽃받침인 sepal의 길이와 너비, 그리고 꽃잎인 petal의 길이와 너비 값을 기록한 데이터로 이 데이터..
-
CharlesBookClub.csv
CharlesBookClub.csv · 찰스 북클럽 회원 개인의 과거 실제 데이터셋입니다. · This data set represents information associated with individuals who are members of a book club. · 한 사람이 책 구매시 함께 구매한 책 정보가 포함되어 있습니다. · 4,000 거래 Description of Variables attribute description Seq# Sequence number in the partition ID# Identification number in the full (unpartitioned) market test data set Gender O=Male 1=Female M Monetary- Tota..