달력

1

« 2020/1 »


 

사분위수(Quantile)

·       데이터를 가장 작은 수부터 가장 큰 수까지 크기가 커지는 순서대로 정렬하고 이를 4등분했을 각각 1/4, 2/4, 3/4, 4/4 위치에 있는 수를 지칭합니다.

·       데이터를 크기 순서로 늘어놓았을 때 25%에 해당하는 값을 제1사분위수, 50%에 해당하는 값을 중앙값(median), 75%에 해당하는 값을 제3사분위수로 표시합니다.

·       위치를 1/100 단위로 나눈 백분위수(percentile)을 사용하기도 하는데 이때 1사분위수는 25% 백분위수와 같고 2분위수는 50% 백분위수이고 3분위수는 75% 백분위수이고 최댓값은 100% 백분위수가 됩니다.

 

분위수

설명

1st Qu

·       Lower Quartile

·       1사 분위수 (25% 백분위수)

·       1/4의 위치

·       전체 데이터의 수가 만약 100개이면 처음부터 25번째에 있는

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 에 있는 값

·       하위 25%의 값을 의미

2st Qu

 

·       중앙값(median) 중위수

·       2사분위수 (50% 백분위수)

·       2/4의 위치


3st Qu

·       Upper Quartile

·       3 분위수 (75% 백분위수)

·       3/4의 위치

·       컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 에 있는 값

·       상위 75% 값을 의미

4st Qu

·       4사분위수 (100% 백분위수)

·       4/4의 위치

·       최댓값

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

가설검정 방향에 따른 변화  (0) 2020.01.16
2.Summary - 2. 빅데이터 모델 개발하기  (0) 2020.01.16
사분위수(Quantile)  (0) 2020.01.15
데이터 분석 기법 선정  (0) 2020.01.15
공분산 값 의미  (0) 2020.01.15
R 코드 예시 - 데이터 분할  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

문자열 인덱싱(Indexing)

·       인덱싱(Indexing)이란 무엇인가를 "가리킨다"는 의미를 가지고 있습니다.

·       문자열의 인덱스를 특정 문자를 추출할 있습니다.

·       시작위치와 끝위치가 생략될 경우 처음위치과 마지막위치로 인식합니다.

·       음수 인덱스를 사용할 있습니다. 인덱스 앞에 '(마이너스)' 붙이면 뒤에서부터 인덱싱합니다.

 

 

 

 

 

인덱싱 형식

인덱스는 대괄호([]) 사용하여 지정합니다.

[인덱스]

[시작위치:끝위치]

 

>>> 'python'[0]

'p'

>>> 'python'[3]

'h'

>>> 'python'[5]

'n'

>>> 'python'[1:4]

'yth'

>>> 'python'[-3:]

'hon'

>>> 'python'[:4]

'pyth'

 

 

 

 

 

 

인덱스 위치값(offset; 오프셋 index)

 

p

y

t

h

o

n

0

1

2

3

4

5

-6

-5

-4

-3

-2

-1

 

 

 


'Development > Python' 카테고리의 다른 글

make 계열 메소드  (0) 2020.01.16
버블 차트(bubble chart)  (0) 2020.01.16
문자열 인덱싱(Indexing)  (0) 2020.01.15
문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

문자열안에 ' 또는 " 표시하기

문자열 안에도 작은따옴표와 큰따옴표가 들어 있어야 할 경우 아래와 같이 사용해야 합니다.

"문자열'문자열"

'문자열"문자열'

'문자열\'문자열'

'문자열\"문자열'

 

 


'Development > Python' 카테고리의 다른 글

버블 차트(bubble chart)  (0) 2020.01.16
문자열 인덱싱(Indexing)  (0) 2020.01.15
문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 14:31

None Development/Python



 

 

None

·       반드시 앞에 대문자로 시작합니다.

·       None 아무것도 아닌 것을 의미하며 '아무 값도 없다'를 나타내는 객체입니다.

·       타 언어의 Null과 같은 개념입니다.

·       파이션에서는 변수를 미리 선언하지 않고 데이터 저장시 변수를 선언하여 사용합니다.(미리 변수를 정의할 필요가 없습니다.)

·       None 조건식에서 False 처리됩니다.

 

a = None

 

 

 

 

 

사용하지 않는 변수 선언시

a


 

 

 

 

 

 

None으로 변수 선언시

소스코드

a = None

 

# 변수에 a의 저장된 값 확인

print(a)

 

 

 

출력결과


 

 


'Development > Python' 카테고리의 다른 글

문자열 인덱싱(Indexing)  (0) 2020.01.15
문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

데이터 분석 기법 선정

적절한 분석 기법을 선택할 있습니다.

 

문제

분석 기법 선정 고려사항

분석 기법

·         연령에 따른 스마트폰 데이터 사용량을 알보고자 합니다.

·         수행되어야할 분석 기법은 무엇일까요?

·         변수의 개수는?

·         선형적인 관계인가?

·         상관분석

·         스마트폰에 설치된 애플리케이션의 개수 데이터 사용량 미치는 영향을 분석하고자 합니다.

·         수행되어야 분석 기법은 무엇일까요?

·         변수 간에 인과관계가 있는가?

·         함수 관계에 있는가?

·         회귀분석

·         개인 특성 데이터 사용량 상관관계를 분석하고자 합니다.

·         개인 특성에 포함되는 변수로는 연령, , 몸무게, 스마트폰 구매 시기, 디스플레이 크기, 평균 스마트폰 사용시간, 평균 사용시간등을 선정하여 데이터를 수집하였습니다.

·         데이터 사용량에 영향을 주는 주요 변수를 찾기 위해 수행되어야 분석 기법은 무엇일까요?

·         변수들의 상관관계를 이용해 기존 변수들을 분산이 변수로 변환시키면 유의성이 높은 변수들로 데이터를 표현할 있는가?

·         주성분 분석

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

2.Summary - 2. 빅데이터 모델 개발하기  (0) 2020.01.16
사분위수(Quantile)  (0) 2020.01.15
데이터 분석 기법 선정  (0) 2020.01.15
공분산 값 의미  (0) 2020.01.15
R 코드 예시 - 데이터 분할  (0) 2020.01.15
3.Summary - 3.데이터 검증하기  (0) 2020.01.14
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 12:35

스왑(swap) Development/Python



 

 

스왑(swap)

·       스왑(swap)은 값을 바꾸는 것을 의미합니다.

·       대입연산자를 통해 간단하게 변환하기를 있습니다.

 

 

 

 

 

 

두 변수의 값을 swap(스왑)하기

x = 1000

y = 2000

print(x)

print(y)

 

x, y = y, x

print(x)

print(y)

1000

2000

2000

1000

 

 


'Development > Python' 카테고리의 다른 글

문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

공분산

공분산

의미

양의

 

cov > 0

·         양의 상관관계

·         변수가 커질 다른 변수가 함께 커지거나, 변수가 작아질 다른 변수가 함께 작아지는 것과 같이 크기 변화의 방향이 같은 경우

·         2개의 변수중 하나의 값이 상승하는 경향을 보일 , 다른 값도 상승하는 경향의 상관관계에 있는 경우

·         변수가 상승 나머지 변수도 상승하는 경향 공분산은 양의 값을 가집니다.

 

·         표본들의 산포와 공분산과의 관계


 

음의

 

cov < 0

·         음의 상관관계

·         변수가 커질 다른 변수가 작아지거나 변수가 작아질 다른 변수가 커지는 경우

·         2개의 변수중 하나의 값이 상승하는 경향을 보일 , 다른 값이 하강하는 경향을 보이는 경우

·         변수가 상승 나머지 변수는 하강하는 경향 공분산은 음의 값을 가집니다.

 

·         표본들의 산포와 공분산과의 관계


 

0

 

cov 0

·         상관 관계가 없음

·         변수의 값이 서로 상관없이 움직이는 경우

 

·         표본들의 산포와 공분산과의 관계


 

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

사분위수(Quantile)  (0) 2020.01.15
데이터 분석 기법 선정  (0) 2020.01.15
공분산 값 의미  (0) 2020.01.15
R 코드 예시 - 데이터 분할  (0) 2020.01.15
3.Summary - 3.데이터 검증하기  (0) 2020.01.14
LOOCV(Leave-One-Out-Cross-Validation)  (0) 2020.01.14
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 11:52

세미콜론(;) Development/Python


 

 

세미콜론(;)

·       세미콜론(;)하나의 구문이 끝났음을 명시적으로 나타내는 기호입니다.

·       두 문장을 한 줄에 이어 쓸 때 세미콜론(;)을 사용합니다.

·       세미콜론(;)은 프로그램 가독성 문제로 자주 사용되지는 않습니다.

 

 

아래의 두개의 형식은 동일하게 수행되어 지지만 코딩된 라인수에만 차이가 있습니다.

하나의 구문

또 하나의 구문

하나의 구문; 하나의 구문

 

 

 

 

 

 

한줄에 여러 구문 표시하기

·       한줄에 여러구문을 사용하고 싶을 때 세미콜론을 사용합니다.

·       세미콜론을 생략할 경우 줄바꿈을 명령의 끝으로 간주하게 됩니다.

 

>>> c = 30; print(c + 5)  #세미콜론 생략시 줄바꿈을 명령의 끝으로 간주

35

>>> d = 40; print(d + 5);

45

>>> result = c + d; print(result);

70

 

 


'Development > Python' 카테고리의 다른 글

None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
cor()  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 09:25

대입연산자 Development/Python


 

 

대입연산자

·       '=' 기준으로 오른쪽의 값을 왼쪽의 변수에 저장(할당, 대입)하는 역할을 합니다.

·       = 대입 연산자를 사용한 구문을 할당문(Assignment)이라고 합니다.

·       구문(Statement) 표현식(Expression)이 아니기 때문에 변수에 할당할 없습니다.

·       등호 왼쪽에 표현식(1+3)이 오면 안됩니다.(변수가 와야 함) 표현식은 대입연산자 오른쪽에만 올 수 있습니다.

 

 

변수 =

변수 = 표현식

 

 

 

'=' '=' 기준으로 오른쪽의 값 10을 왼쪽의 변수 n에 저장하는 '대입 연산자'입니다.

>>> n=10

 

 

 

 



'Development > Python' 카테고리의 다른 글

스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
cor()  (0) 2020.01.15
TensorFlow - install  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 02:30

! Development/Python



 

 

!

·         ! 기호를 사용해서 문자열 변환을 있습니다.

·         !s, !r, !a 각각 str(), repr(), ascii()  실행한 결과와 동일한 결과가 출력됩니다.

 

!

method

description

!s

str()

실제값과 다르게 표현될 있습니다.

!r

repr()

형식적으로 동일한 결과를 표현합니다.

!a

ascii()

아스키코드이외 값은 백슬레시 포함한 유니코드값 반환합니다.

 

 

 

 

print("{id!s} is {name!s}".format(**dic))

print("{id!r} is {name!r}".format(**dic))

print("{id!a} is {name!a}".format(**dic))

 


'Development > Python' 카테고리의 다른 글

세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
cor()  (0) 2020.01.15
TensorFlow - install  (0) 2020.01.15
할당된 메모리 공간 확인하기  (0) 2020.01.14
Posted by codedragon codedragon

댓글을 달아 주세요