달력

2

« 2020/2 »

  •  
  •  
  •  
  •  
  •  
  •  
  • 1


 

 

라인 플롯(line plot)

·       선을 그리는 가장 간단형태의 플롯입니다.

·       데이터가 시간, 순서 등에 따라 어떻게 변화하는지 보여주기 위해 사용합니다.

 

 

 

 

plot()

·       라인 플롯(line plot) 그려줍니다.

·       플롯 명령어들을 그림을 더 잘 표현하기 위해 다양한 스타일(style)을 지원합니다

·       kind 인수에 문자열을 쓰는 대신 plot.bar처럼 직접 메서드로 사용할 수도 있습니다.

·       그룹 분석 결과도 데이터프레임이므로 같은 방식으로 시각화할 수 있습니다.

 

matplotlib.pyplot.plot(*args, **kwargs)

 

parameter

description

kind

여러가지 플롯타입을 설정할 있습니다.

bar, pie, hist, kde, box, scatter, area 하나를 지정합니다.

 

 

https://matplotlib.org/api/_as_gen/matplotlib.pyplot.plot.html

 

 

 


 

 


'Development > Python' 카테고리의 다른 글

Pandas 시각화  (0) 2020.02.13
히스토그램(histogram)  (0) 2020.02.13
라인 플롯(line plot)  (0) 2020.02.13
titanic 데이터 셋 컬럼 정보  (0) 2020.02.13
pd.get_dummies()  (0) 2020.02.13
multinomial()  (0) 2020.02.13
Posted by codedragon codedragon

댓글을 달아 주세요


 

밀도 추정(Density Estimation)

·       통계학에서 다루는 용어로 데이터와 변수의 관계를 파악하는 방법입니다.

·       데이터로 부터 변수가 가질 수 있는 모든 값의 밀도(확률)을 추정하는 것입니다.

 

 

https://en.wikipedia.org/wiki/Density_estimation


Posted by codedragon codedragon

댓글을 달아 주세요

 

 

titanic 데이터 셋 컬럼 정보

Variable

Definition

survival

생존 여부

1

Yes(생존)

0

No(사망)

 

 

pclass

객차 등급 정보

1

1st(1등석)

2

2nd(2등석)

3

3rd(3등석)

 

 

sex

성별

Age

나이

sibsp

함께 탑승한 형제 또는 배우자의 수

Sibling

brother, sister, stepbrother, stepsister

Spouse

husband, wife (정부와 약혼녀는 무시)

 

parch

함께 탑승한 부모 또는 자녀의 수

Parent

mother, father

Child

daughter, son, stepdaughter, stepson

0

유모만 데리고 여행한 아이들은 parch=0 됩니다.

 

ticket

티켓 번호

fare

티켓 요금

cabin

선실 번호(객실번호)

embarked

탑승한 곳

 

C

·       Cherbourg

·       체르부르크; 프랑스 서북부의 도시

Q

·       Queenstown

·       퀸스타운;  뉴질랜드 남섬 오타고 지방의 내륙, 와카티푸 호수 기슭에 위치한 도시

S

·       Southampton

·       사우샘프턴; 영국 남부 해안의 항구 도시

 

 

 


'Development > Python' 카테고리의 다른 글

히스토그램(histogram)  (0) 2020.02.13
라인 플롯(line plot)  (0) 2020.02.13
titanic 데이터 셋 컬럼 정보  (0) 2020.02.13
pd.get_dummies()  (0) 2020.02.13
multinomial()  (0) 2020.02.13
binom()  (0) 2020.02.13
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

pd.get_dummies()

·         원핫인코딩(one-hot encoding; 가변수) 수행합니다.

·         get_dummies 사용하면 문자열 특성만 인코딩 되며 숫자 특성은 바뀌지 않는다.

·         pandas get_dummies 함수는 숫자 특성은 모두 연속형이라고 생각해서 원핫인코딩(가변수) 만들지 않습니다.

 

 

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)

 

 

parameter

description

prefix

옵션을 사용하면 가변수에 공통으로 접두사를 추가할 있습니다.

drop_first=True

가변수의 첫번째 변수를 자동으로 삭제를 해줘서, 가변수 함정(dummy variable trap) 피할 있게 해줍니다.


columns

숫자 특성도 가변수로 만들고 싶다면 columns 매개변수에 인코딩하고 싶은 열을 명시합니다.

 

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.get_dummies.html

 


'Development > Python' 카테고리의 다른 글

라인 플롯(line plot)  (0) 2020.02.13
titanic 데이터 셋 컬럼 정보  (0) 2020.02.13
pd.get_dummies()  (0) 2020.02.13
multinomial()  (0) 2020.02.13
binom()  (0) 2020.02.13
sns.barplot()  (0) 2020.02.12
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 2. 13. 05:37

multinomial() Development/Python


 

 

{SciPy} 카테고리 분포 사용하기

·         SciPy 카테고리 분포를 위한 별도의 클래스를 제공하지 않습니다.

·         다항 분포를 위한 multinomial 클래스에서 시행 횟수를 1 설정하면 카테고리 분포가 됩니다.

 

 

 

multinomial()

import scipy.stats

scipy.stats.multinomial(1, data)

 

 


'Development > Python' 카테고리의 다른 글

titanic 데이터 셋 컬럼 정보  (0) 2020.02.13
pd.get_dummies()  (0) 2020.02.13
multinomial()  (0) 2020.02.13
binom()  (0) 2020.02.13
sns.barplot()  (0) 2020.02.12
확률분포 클래스 객체 생성  (0) 2020.02.12
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

카테고리 분포(Categorical distribution)

·         베르누이 분포의 확장판입니다.

·         베르누이 분포 0 이나 1(또는 -1 이나 1) 나오는 확률변수의 분포 동전을 던져서 나오는 경우 동전을 던져 나오는 결과를 묘사할 사용 있습니다.

·         동전이 아닌 주사위를 던져서 나오는 경우 묘사할 때는 카테고리 분포 사용할 있습니다. 카테고리 분포는 1부터 K까지의  K 개의 정수 하나가 나오는 확률변수의 분포입니다. 따라서 주사위를 던져 나오는 눈금의 수는  K=6 카테고리 분포가 됩니다.

·         카테고리 분포를 가진 확률변수는 원래 카테고리인 스칼라 값을 출력하는 확률변수지만 1 0으로만 이루어진 다차원 벡터로 변형하여 사용합니다. 이러한 인코딩 방식을 --인코딩(One-Hot-Encoding) 이라고 합니다.

 

 



 

 

 

주사위의 --인코딩

 

경우의

One-Hot-Encoding

x=1

x=(1,0,0,0,0,0)

x=2

x=(0,1,0,0,0,0)

x=3

x=(0,0,1,0,0,0)

x=4

x=(0,0,0,1,0,0)

x=5

x=(0,0,0,0,1,0)

x=6

x=(0,0,0,0,0,1)

 

 


Posted by codedragon codedragon

댓글을 달아 주세요

2020. 2. 13. 04:47

binom() Development/Python


 

 

binom 클래스

·         {Scipy} 패키지의 stats 서브 패키지에 있습니다.

·         이항 분포 확률변수를 구현하고 있는 클래스입니다.

 

 

 

 

binom()

stats.binom(n, p)

 

인자

설명

n

전체 시도 횟수  N

p

베르누이 확률 분포의 기댓값  μ

 

 


'Development > Python' 카테고리의 다른 글

pd.get_dummies()  (0) 2020.02.13
multinomial()  (0) 2020.02.13
binom()  (0) 2020.02.13
sns.barplot()  (0) 2020.02.12
확률분포 클래스 객체 생성  (0) 2020.02.12
stats 서브패키지  (0) 2020.02.12
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

 

이항 분포(二項; binomial distribution)

·         이항 확률 분포

·         n번의 독립적 시행에서 시행이 확률 p 가질 시행을 성공했는지를 표현하는 이산확률분포

 

 

 

이항 분포의 확률 함수는 아래와 같이 표현됩니다.

 


 

 

 

Posted by codedragon codedragon

댓글을 달아 주세요