2019/12(246)
-
Machine Learning Open Source Software (MLOSS)
MLOSS JMLR Machine Learning Open Source Software (MLOSS) http://jmlr.org/mloss/ mloss.org forum for open source software in machine learning https://mloss.org/software/
-
Apache Mahout(아파치 머하웃)
Apache Mahout(아파치 머하웃) · 대용량 데이터를 처리하는 분산처리가 가능하고 확장성을 가진(scalable) 기계학습용 오픈 소스 라이브러리입니다. · Apache project to produce free implementations of distributed or otherwise scalable machine learning algorithms · Classification, clustering, and collaborative filtering, frequent itemset mining · 맵리듀스를 이용하는 아파치 하둡위에 적용되며 비슷한 특성을 가진 데이터들을 분류하고 정의하는 작업 및 협업 필터링(collaborative filtering)을 수행합니다. https://en.w..
-
KNIME
KNIME · Konstanz Information Miner · modular data pipelining concept https://www.knime.com/
-
MOA (Massive Online Analysis)
MOA (Massive Online Analysis) · Closely related project to the WEKA project · Open source framework for data stream mining https://moa.cms.waikato.ac.nz/ https://github.com/waikato/moa
-
3.Summary - 3.빅데이터 수집·변환 모듈 개발하기
내·외부 데이터의 수집 방법
-
IRIS 데이터 셋
IRIS 데이터 셋 · IRIS 데이터 셋은 우리나라에서 붓꽃(IRIS)으로 해석되는 데이터입니다. · 아이리스는 통계학자인 피셔(Fisher) 가 공개한 데이터입니다. · 머신러닝과 통계 분야에서 오래전부터 사용해온 데이터 셋입니다. · 붓꽃들은 Iris setosa(세토사), Iris virginica(버지니카), Iris versicolor(베르시칼라) 세 가지 종류가 있으며 이 붓꽃을 분류한 데이터입니다. · 붓꽃들은 꽃받침과 꽃잎의 비율로 품종을 구분하기 때문에 연구 끝에 꽃잎의 각 부분의 너비와 길이 등을 측정하여 데이터로 만들었으며 150개의 레코드로 구성되어 있습니다. · 붓꽃에 따라 꽃받침인 sepal의 길이와 너비, 그리고 꽃잎인 petal의 길이와 너비 값을 기록한 데이터로 이 데이터..