달력

11

« 2019/11 »

  •  
  •  
  •  
  •  
  •  
  • 1
  • 2



 

 

 

기본적인 기계학습 6단계

단계

설명

1

data loader

·         데이터 불러오기

·         훈련 데이터와 텍스트 데이터를 기본 8:2 분리

2

filtering

·         필터링

2

class assigner

·         목표 변수(class) 설정

·         찾고자하는 속성 지정

3

cross validate setting

·         평가 객체 생성 설정

·         분류기 적용

4

random forest run

·         모델 학습

5

evaluate

·         모델 평가, 모델 검증

6

print Result

·         print Result text

·         시각화

 


'Development > Java' 카테고리의 다른 글

회귀분석 유형  (0) 2019.11.25
JAVA 위상  (0) 2019.11.25
기본적인 기계학습 6단계  (0) 2019.11.24
WEKA J48  (0) 2019.11.24
Weka - 라이브러리, 패키지 설치하기 w/Package manager  (0) 2019.11.23
WEKA - J48 가지치기 옵션  (0) 2019.11.21
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

scrapy

·         Scraping 도와주기위한 파이썬 기반 라이브러리

·         웹사이트를 크롤링하고 구조화된 데이터를 수집하는 애플리케이션 프레임워크입니다.

·         scrapy 데이터마이닝, 정보 처리, 이력 기록 같은 다양한 애플리케이션에 유용하게 사용될 있습니다.

·         현재 scrapy 최근 안정 버전은 1.8.0 입니다. (2019)

 

 

 

 

https://scrapy.org/


 

 

 

Scrapy Tutorial

https://doc.scrapy.org/en/latest/intro/tutorial.html


 

 


Posted by codedragon codedragon

댓글을 달아 주세요


 

 

비즈니스 아키텍처(Business Architecture)

·         비즈니스를 성공적으로 이끌기 위한 시스템 설계 합니다.

·         요구 사항을 만족하는 시스템 개발을 위한 비즈니스 모델을 도식화합니다.

·         비즈니스의 목표를 이해하고 비즈니스의 전략 이해를 통해 부합하는 아키텍처를 설계합니다.

 

 

 

 


Posted by codedragon codedragon

댓글을 달아 주세요

2019. 11. 24. 03:30

WEKA J48 Development/Java



 

 

 

J48

·         C4.5 algorithm Weka data mining tool도구에서는 J48이라고 합니다.

·         하향식 유도 정보이론을 기반을 두고 있습니다.

·         10 전까지는최고의 데이터마이닝 알고리즘(분류기)으로 사용되어졌습니다.

 

 

 

 

Class J48

http://weka.sourceforge.net/doc.dev/weka/classifiers/trees/J48.html

 

 

 


Posted by codedragon codedragon

댓글을 달아 주세요


 

 

 

비교사 학습(Unsupervised Learning)

·         자율학습 비지도학습

·         클러스터링(clustering)

·         입력은 있지만 정해진 출력이 없으며, 순수하게 데이터들이 갖고 있는 속성들을 이용(탐색) 그룹으로 나누는 경우를 말합니다.

·         사람 없이 컴퓨터가 스스로 레이블 되어 있지 않은 데이터에 대해 학습하는 것입니다.

·         데이터가 어떻게 구성되어 있는지 패턴을 알아내는 방법입니다.

·         지도학습이 회귀 방법을 사용하는 것과 달리, 군집(clustering) 해당됩니다.

·         입력 데이터에 결과 값이 포함되어 있지 않습니다. 데이터의 그룹을 묶을 있는 어떠한 사전 정보도 주어지지 않습니다.

 

·         데이터 분석의 목적이 명확히 정의된 형태의 특정 필드의 값을 구하는 것이 아니라 데이터 자체의 결합, 연관성, 유사성등을 중심으로 데이터의 상태 표현하는 것입니다.

·         일반적으로 상향식 접근 방식의 데이터 분석 비지도 학습방법에 의해 수행됩니다.

·         계측적 군집 별도의 반응변수가 요구되지 않는 비지도 학습 기법입니다.

 

·         자율학습의 대표적 기술에는 밀도 추정(Density Estimation), 군집화(Clustering) 등이 있습니다. 주로 군집화(Clustering) 사용됩니다.

 

 

 

사람들이 나이, 학력, 성별, 출생 지역 등의 조합에 따라 어떤 정당을 지지하는지 살펴보는 , 고객 데이터를 통해 고객을 그룹핑하는 것도 자율 학습에 속합니다.


 

 

 


Posted by codedragon codedragon

댓글을 달아 주세요

2019. 11. 24. 01:00

linspace() Development/Python



 

 

linspace()

·         {NumPy} 패키지의 함수입니다.

·         linspace()함수와 logspace()함수는 선형 구간 혹은 로그 구간을 지정한 구간의 수만큼 분할합니다.

 

 

np.linspace(시작, (포함), 갯수)

 

 


Posted by codedragon codedragon

댓글을 달아 주세요