달력

11

« 2019/11 »

  •  
  •  
  •  
  •  
  •  
  • 1
  • 2
2019. 11. 12. 14:02

THE UNICORN LIST StartUp

 

 

THE UNICORN LIST

·       포춘에서 스타트업 기업을 대상으로 매기는 순위

·       유니콘(Unicorn)은 기업 가치가 1조원($1 billion)이 넘는 스타트업 기업을 의미

·       데카콘은 기업 가치가 10조원이 넘는 스타트업 기업을 의미(데카(Deca)는 라틴어로 10을 의미)

http://fortune.com/unicorns/


 


Posted by codedragon codedragon

댓글을 달아 주세요

  1. 2019.11.12 14:30  댓글주소  수정/삭제  댓글쓰기

    비밀댓글입니다


 

 

데이터 정제

·         데이터 셋을 쉽게 사용할 있도록 하는 과정입니다.

·         빅데이터 처리에서 가장 중요한 작업 하나는 정제입니다.

·         정제가 제대로 이루어지지 않을 경우 데이터의 구성이 일관되지 않으므로 빅데이터를 분석하는데 문제가 생기게 됩니다.

·         다양한 매체로부터 데이터를 수집하여 원하는 형태로 변화는 것입니다.

 


 

 

 

 

'Development > Big Data, R, ...' 카테고리의 다른 글

데이터 전처리(Data preprocessing)  (0) 2019.11.13
데이터 정제 방법  (0) 2019.11.13
데이터 정제  (0) 2019.11.12
동전 던지기  (0) 2019.11.12
이상치(anomaly) 처리  (0) 2019.11.11
맥주와 기저귀  (0) 2019.11.11
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

 

동전 던지기

구분

개념

확률표본 표본(sample)

·         앞면(Front) 나오는 현상

·         뒷면(Back) 나오는 현상

표본공간

·         앞면과 뒷면 가지 원소(표본)로만 구성된 집합

가능한 사건(event) 부분집합

·         동전의 앞면이 나오는 경우

·         동전의 앞면이 나오거나 뒷면이 나오는 경우

 

 

 


http://bit.ly/35CTruc

 

 

구분

설명

사건의 가능성

동전을 던졌을 결과는 가지, 앞면 또는 뒷면이다. 사건의 가능성은 50% 입니다.

동전 던지기의 결과

동전 던지기의 결과는 다음과 같이 표시할 있습니다.

 

p(앞면이 나온다) = 0.5(또는 ½ 또는 50%)

p(뒷면이 나온다) = 0.5(또는 ½ 또는 50%)

다음 동전 던지기에서 앞면이 나올 확률

"다음 동전 던지기에서 앞면이 나올 확률은" 답은 1/2입니다. 가능한 결과는 오직 가지 입니다.

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

데이터 정제 방법  (0) 2019.11.13
데이터 정제  (0) 2019.11.12
동전 던지기  (0) 2019.11.12
이상치(anomaly) 처리  (0) 2019.11.11
맥주와 기저귀  (0) 2019.11.11
정분류율 & 오분류율  (0) 2019.11.10
Posted by codedragon codedragon

댓글을 달아 주세요




 

 

교환 법칙과 분배 법칙

·       행렬의 교환 법칙과 분배 법칙

·       전치 연산에서의 분배 법칙

 

A , B, C 아래와 같을때 "교환 법칙과 분배 법칙" 확인해봅니다.






 

 

행렬의 교환 법칙과 분배 법칙

행렬의 곱셈은 곱하는 행렬의 순서를 바꾸는 교환 법칙이 성립하지 않습니다. 그러나 덧셈에 대한 분배 법칙은 성립합니다.

 

법칙

표현식

교환 법칙 불가

AB BA

덧셈에 대한 분배 법칙 성립

A(B+C) = AB+AC

덧셈에 대한 분배 법칙 성립

(A+B)C = AC+BC

 

 

 



 

 

전치 연산에서의 분배 법칙

·       전치 연산도 덧셈/뺄셈에 대해 분배 법칙이 성립합니다.

·       전치 연산과 곱셈의 경우에는 분배 법칙이 성립하기는 하지만 전치 연산이 분배되면서 곱셈의 순서가 바뀝니다.

 

법칙

표현식

덧셈/뺄셈에 대해 분배 법칙 성립

(A+C)T = ATBT

곱셈에 대한 분배 법칙 성립

(AB)T = BTAT

곱셈에 대한 분배 법칙 성립

(ABC)T = CTBTAT

 

 

Posted by codedragon codedragon

댓글을 달아 주세요


 

 

이상치(anomaly) 처리

 

구분

이상치 처리방법

단순 오류에 의한 이상치

단순 오류로 판단될 경우 이상치를 제거하거나 무시한 분석을 수행

특이값인 이상치

특이값인 경우에는 관심을 두고 분석을 수행

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

데이터 정제  (0) 2019.11.12
동전 던지기  (0) 2019.11.12
이상치(anomaly) 처리  (0) 2019.11.11
맥주와 기저귀  (0) 2019.11.11
정분류율 & 오분류율  (0) 2019.11.10
일반 분류기 vs 컨볼루션 신경망  (0) 2019.11.10
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

 

맥주와 기저귀

대형 마트는 기저귀를 사러 왔다가 맥주까지 사가는 사내의 습성을 보고

(기저귀를 사는 고객은 맥주를 동시에 구매한다는 연관규칙을 알아낸 것을 통해)

기저귀와 맥주를 인접한 진열대에 위치해 놓으니 매출 증대를 꾀할 있었습니다.

 


https://bit.ly/33Y7R6B

 

이야기는 전 세계 마케팅 부서를 통해 전파되고 있으며, 키노트부터 잡담, 해커톤에서 늦은 밤까지 이어진 코드 잼 등 모든 곳에서 회자되고 있습니다

 

토마스 블리촉(Thomas Blischok)은 마인드멜드(mindmeld)라는 회사의 CEO일 때 과거, 현재, 미래의 데이터 마이닝에 관한 웹 캐스트 패널이었으며, 맥주와 기저귀 스토리를 낳은 데이터 연구를 하고 있었습니다. 그 연구는 1990년대 초반에 실행되었는데, 그의 팀은 오스코 드럭(Osco Drug) 사의 장바구니 데이터를 연구했습니다. 토마스의 팀들은 오후 5시와 7시 사이 장바구니에 상관 관계가 있음을 발견하고 고객사에 이를 보고하였다.

이후 이야기는 여러 가지 변형된 이야기가 회자되고 있습니다.

 

 

www.dssresources.com/newsletters/66.php

99.txt


 


'Development > Big Data, R, ...' 카테고리의 다른 글

동전 던지기  (0) 2019.11.12
이상치(anomaly) 처리  (0) 2019.11.11
맥주와 기저귀  (0) 2019.11.11
정분류율 & 오분류율  (0) 2019.11.10
일반 분류기 vs 컨볼루션 신경망  (0) 2019.11.10
Jitter(지터)  (0) 2019.11.09
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

예외 처리 try 구문

try:

    <예외 발생가능성이 있는 문장>

except <예외 종류> :

    <예외 처리 문장>

except (예외 1, 예외 2):

    <예외 처리 문장>

except 예외 as 인자:

    <예외 처리 문장>

except :

 

else:

    <예외가 발생하지 않은 경우, 수행할 문장>

finally:

    <예외 발생 유무에 상관없이 try 블록 이후 수행할 문장>

 


 

 

 

 

 

 

 

try ~ except ~ else

·         try 블럭 내의 어느 문장에서 에러가 발생하면, except 문으로 이동하고 예외 처리를 있습니다.

·         else절은 예외가 발생하지 않은 경우에 실행되며 반드시 except 바로 다음에 위치해야 합니다.

 

·         except 뒤에 아무것도 쓰지 않았으면 어떤 에러이든 발생하면 해당 except 블럭을 수행하라는 의미입니다.

·         except 여러 개인 경우는 범위가 보다 좁은 에러타입을 앞에 쓰고 보다 일반적이고 포괄적인 에러타입을 뒤에 작성해 주어야 순차적으로 에러를 캐취할 있습니다.

 

try:

    ...

except :

    # 예외처리

else:

    ...

finally:

    ...

 

여러개의 Exception들을 동일한 except 블록으로 처리하고자 경우 발생 Expception들을 하나의 except 으로 묶어주면 됩니다.

try:

    ...

except (예외 1, 예외 2):

    # 예외처리

else:

    ...

finally:

    ...

 

 

 

 

 

 

try ~ finally

·         try문에는 finally절을 사용할 있다.

·         finally절은 try 수행 도중 예외 발생 여부에 상관없이 항상 수행되어 지는 부분입니다.

·         , finally 블럭은 try 블럭이 정상적으로 실행되든, 에러가 발생하여 except 블럭이 실행되든 상관없이 항상 마지막에 실행됩니다.

·         보통 finally절은 사용한 자원의 리소스를 정리(close)하기위해 사용되어집니다.

 

 

아래와 같은 구조인 경우, finally 생략 불가

try:

<예외 발생 가능성이 있는 문장>

finally:

<예외와 관계없이, 항상 수행되어야 문장>

 

 



'Development > Python' 카테고리의 다른 글

행/열 합계 - sum()  (0) 2019.11.13
교환 법칙과 분배 법칙  (0) 2019.11.12
예외 처리 try 구문  (0) 2019.11.11
지도 API 사용 방법  (0) 2019.11.10
실제 행렬을 사용한 곱셈의 예  (0) 2019.11.09
멤버 메서드 종류  (0) 2019.11.09
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

SQL(Standard Query Language)

·         SQL RDBMS 표준 언어

·         SQL문을 이용해서 단순한 쿼리뿐만 아니라 데이터 베이스 객체를 만들거나, 제거하고, 데이터를 삽입, 갱신, 삭제하거나 다양한 운영 관리 작업을 있습니다.

·         SQL문이 첫선을 보인 것은 1970년대 IBM 의해서이며, 이후 ANSI/ISO 표준으로 편입되어 여러 차례의 개량과 개발을 거쳤다.

·         https://codedragon.tistory.com/8225

 

 

 

 

SQL 종류

구분

설명

DDL

데이터와 구조를 정의하는 언어

DML

데이터의 검색과 수정을 위한 언어

DCL

데이터 베이스의 권한을 정의하는 언어

 

 

 

 

 

DDL 관련 SQL

SQL

설명

CREATE

데이터베이스 객체를 생성합니다.

DROP

데이터베이스 객체를 삭제합니다.

ALTER

기존에 존재하는 데이터베이스의 객체를 다시 정의하는 역할을 합니다.

 

 

 

 

 

 

DML 관련 SQL

SQL

설명

INSERT

데이터베이스 객체에 데이터를 입력합니다.

UPDATE

데이터베이스 객체에 데이터를 갱신합니다.

SELECT

데이터베이스 객체에 데이터로 부터 데이터를 검색합니다.

COMMIT

커밋 구문 전에 발생한 데이터베이스 액션을 영구히 저장합니다.

ROLLBACK

마지막으로 발생한 커밋 후의 데이터베이스 액션을 원시 데이터로 복구합니다.

 

 

 

 

DCL 관련 SQL

SQL

설명

GRANT

데이터베이스 객체에 권한을 부여

REVOKE

이미 부여된 데이터베이스 객체의 권한을 취소

 

 


Posted by codedragon codedragon

댓글을 달아 주세요



 

 

WEKA API documentation

http://weka.sourceforge.net/doc.dev/overview-summary.html


 

 


'Development > Java' 카테고리의 다른 글

Wrapper클래스 활용  (0) 2019.11.14
SimpleDateFormat  (0) 2019.11.13
WEKA API documentation  (0) 2019.11.10
WEKA - arff Dataset  (0) 2019.11.10
Hadoop - install for windows (설치 및 설정하기)  (0) 2019.11.10
오버라이딩(Overriding) vs 오버로딩(Overloading)  (0) 2019.11.07
Posted by codedragon codedragon

댓글을 달아 주세요

 

WEKA - arff Dataset

 

airline.arff
0.00MB
breast-cancer.arff
0.03MB
contact-lenses.arff
0.00MB
cpu.arff
0.01MB
cpu.with.vendor.arff
0.01MB
credit-g.arff
0.15MB
diabetes.arff
0.04MB
glass.arff
0.02MB
hypothyroid.arff
0.30MB
ionosphere.arff
0.08MB
iris.2D.arff
0.00MB
iris.arff
0.01MB
labor.arff
0.01MB
ReutersCorn-test.arff
0.49MB
ReutersCorn-train.arff
1.17MB

 

ReutersGrain-test.arff
0.49MB
ReutersGrain-train.arff
1.17MB
segment-challenge.arff
0.19MB
segment-test.arff
0.10MB
soybean.arff
0.19MB
supermarket.arff
1.93MB
unbalanced.arff
0.18MB
vote.arff
0.04MB
weather.nominal.arff
0.00MB
weather.numeric.arff
0.00MB
data.zip
1.60MB

 

Posted by codedragon codedragon

댓글을 달아 주세요