달력

1

« 2020/1 »



 

 

문자열 인덱싱(Indexing)

·       인덱싱(Indexing)이란 무엇인가를 "가리킨다"는 의미를 가지고 있습니다.

·       문자열의 인덱스를 특정 문자를 추출할 있습니다.

·       시작위치와 끝위치가 생략될 경우 처음위치과 마지막위치로 인식합니다.

·       음수 인덱스를 사용할 있습니다. 인덱스 앞에 '(마이너스)' 붙이면 뒤에서부터 인덱싱합니다.

 

 

 

 

 

인덱싱 형식

인덱스는 대괄호([]) 사용하여 지정합니다.

[인덱스]

[시작위치:끝위치]

 

>>> 'python'[0]

'p'

>>> 'python'[3]

'h'

>>> 'python'[5]

'n'

>>> 'python'[1:4]

'yth'

>>> 'python'[-3:]

'hon'

>>> 'python'[:4]

'pyth'

 

 

 

 

 

 

인덱스 위치값(offset; 오프셋 index)

 

p

y

t

h

o

n

0

1

2

3

4

5

-6

-5

-4

-3

-2

-1

 

 

 


'Development > Python' 카테고리의 다른 글

make 계열 메소드  (0) 2020.01.16
버블 차트(bubble chart)  (0) 2020.01.16
문자열 인덱싱(Indexing)  (0) 2020.01.15
문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

문자열안에 ' 또는 " 표시하기

문자열 안에도 작은따옴표와 큰따옴표가 들어 있어야 할 경우 아래와 같이 사용해야 합니다.

"문자열'문자열"

'문자열"문자열'

'문자열\'문자열'

'문자열\"문자열'

 

 


'Development > Python' 카테고리의 다른 글

버블 차트(bubble chart)  (0) 2020.01.16
문자열 인덱싱(Indexing)  (0) 2020.01.15
문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 14:31

None Development/Python



 

 

None

·       반드시 앞에 대문자로 시작합니다.

·       None 아무것도 아닌 것을 의미하며 '아무 값도 없다'를 나타내는 객체입니다.

·       타 언어의 Null과 같은 개념입니다.

·       파이션에서는 변수를 미리 선언하지 않고 데이터 저장시 변수를 선언하여 사용합니다.(미리 변수를 정의할 필요가 없습니다.)

·       None 조건식에서 False 처리됩니다.

 

a = None

 

 

 

 

 

사용하지 않는 변수 선언시

a


 

 

 

 

 

 

None으로 변수 선언시

소스코드

a = None

 

# 변수에 a의 저장된 값 확인

print(a)

 

 

 

출력결과


 

 


'Development > Python' 카테고리의 다른 글

문자열 인덱싱(Indexing)  (0) 2020.01.15
문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

데이터 분석 기법 선정

적절한 분석 기법을 선택할 있습니다.

 

문제

분석 기법 선정 고려사항

분석 기법

·         연령에 따른 스마트폰 데이터 사용량을 알보고자 합니다.

·         수행되어야할 분석 기법은 무엇일까요?

·         변수의 개수는?

·         선형적인 관계인가?

·         상관분석

·         스마트폰에 설치된 애플리케이션의 개수 데이터 사용량 미치는 영향을 분석하고자 합니다.

·         수행되어야 분석 기법은 무엇일까요?

·         변수 간에 인과관계가 있는가?

·         함수 관계에 있는가?

·         회귀분석

·         개인 특성 데이터 사용량 상관관계를 분석하고자 합니다.

·         개인 특성에 포함되는 변수로는 연령, , 몸무게, 스마트폰 구매 시기, 디스플레이 크기, 평균 스마트폰 사용시간, 평균 사용시간등을 선정하여 데이터를 수집하였습니다.

·         데이터 사용량에 영향을 주는 주요 변수를 찾기 위해 수행되어야 분석 기법은 무엇일까요?

·         변수들의 상관관계를 이용해 기존 변수들을 분산이 변수로 변환시키면 유의성이 높은 변수들로 데이터를 표현할 있는가?

·         주성분 분석

 

 


Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 12:35

스왑(swap) Development/Python



 

 

스왑(swap)

·       스왑(swap)은 값을 바꾸는 것을 의미합니다.

·       대입연산자를 통해 간단하게 변환하기를 있습니다.

 

 

 

 

 

 

두 변수의 값을 swap(스왑)하기

x = 1000

y = 2000

print(x)

print(y)

 

x, y = y, x

print(x)

print(y)

1000

2000

2000

1000

 

 


'Development > Python' 카테고리의 다른 글

문자열안에 ' 또는 " 표시하기  (0) 2020.01.15
None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

공분산

공분산

의미

양의

 

cov > 0

·         양의 상관관계

·         변수가 커질 다른 변수가 함께 커지거나, 변수가 작아질 다른 변수가 함께 작아지는 것과 같이 크기 변화의 방향이 같은 경우

·         2개의 변수중 하나의 값이 상승하는 경향을 보일 , 다른 값도 상승하는 경향의 상관관계에 있는 경우

·         변수가 상승 나머지 변수도 상승하는 경향 공분산은 양의 값을 가집니다.

 

·         표본들의 산포와 공분산과의 관계


 

음의

 

cov < 0

·         음의 상관관계

·         변수가 커질 다른 변수가 작아지거나 변수가 작아질 다른 변수가 커지는 경우

·         2개의 변수중 하나의 값이 상승하는 경향을 보일 , 다른 값이 하강하는 경향을 보이는 경우

·         변수가 상승 나머지 변수는 하강하는 경향 공분산은 음의 값을 가집니다.

 

·         표본들의 산포와 공분산과의 관계


 

0

 

cov 0

·         상관 관계가 없음

·         변수의 값이 서로 상관없이 움직이는 경우

 

·         표본들의 산포와 공분산과의 관계


 

 

 


Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 11:52

세미콜론(;) Development/Python


 

 

세미콜론(;)

·       세미콜론(;)하나의 구문이 끝났음을 명시적으로 나타내는 기호입니다.

·       두 문장을 한 줄에 이어 쓸 때 세미콜론(;)을 사용합니다.

·       세미콜론(;)은 프로그램 가독성 문제로 자주 사용되지는 않습니다.

 

 

아래의 두개의 형식은 동일하게 수행되어 지지만 코딩된 라인수에만 차이가 있습니다.

하나의 구문

또 하나의 구문

하나의 구문; 하나의 구문

 

 

 

 

 

 

한줄에 여러 구문 표시하기

·       한줄에 여러구문을 사용하고 싶을 때 세미콜론을 사용합니다.

·       세미콜론을 생략할 경우 줄바꿈을 명령의 끝으로 간주하게 됩니다.

 

>>> c = 30; print(c + 5)  #세미콜론 생략시 줄바꿈을 명령의 끝으로 간주

35

>>> d = 40; print(d + 5);

45

>>> result = c + d; print(result);

70

 

 


'Development > Python' 카테고리의 다른 글

None  (0) 2020.01.15
스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
cor()  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 09:25

대입연산자 Development/Python


 

 

대입연산자

·       '=' 기준으로 오른쪽의 값을 왼쪽의 변수에 저장(할당, 대입)하는 역할을 합니다.

·       = 대입 연산자를 사용한 구문을 할당문(Assignment)이라고 합니다.

·       구문(Statement) 표현식(Expression)이 아니기 때문에 변수에 할당할 없습니다.

·       등호 왼쪽에 표현식(1+3)이 오면 안됩니다.(변수가 와야 함) 표현식은 대입연산자 오른쪽에만 올 수 있습니다.

 

 

변수 =

변수 = 표현식

 

 

 

'=' '=' 기준으로 오른쪽의 값 10을 왼쪽의 변수 n에 저장하는 '대입 연산자'입니다.

>>> n=10

 

 

 

 



'Development > Python' 카테고리의 다른 글

스왑(swap)  (0) 2020.01.15
세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
cor()  (0) 2020.01.15
TensorFlow - install  (0) 2020.01.15
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 1. 15. 02:30

! Development/Python



 

 

!

·         ! 기호를 사용해서 문자열 변환을 있습니다.

·         !s, !r, !a 각각 str(), repr(), ascii()  실행한 결과와 동일한 결과가 출력됩니다.

 

!

method

description

!s

str()

실제값과 다르게 표현될 있습니다.

!r

repr()

형식적으로 동일한 결과를 표현합니다.

!a

ascii()

아스키코드이외 값은 백슬레시 포함한 유니코드값 반환합니다.

 

 

 

 

print("{id!s} is {name!s}".format(**dic))

print("{id!r} is {name!r}".format(**dic))

print("{id!a} is {name!a}".format(**dic))

 


'Development > Python' 카테고리의 다른 글

세미콜론(;)  (0) 2020.01.15
대입연산자  (0) 2020.01.15
!  (0) 2020.01.15
cor()  (0) 2020.01.15
TensorFlow - install  (0) 2020.01.15
할당된 메모리 공간 확인하기  (0) 2020.01.14
Posted by codedragon codedragon

댓글을 달아 주세요

 

 

 

 

R 코드 예시 - 데이터 분할 

{caret} Package createDataPartition()함수를 사용하여 iris data Species 기준으로 70% 훈련용 데이터로 나머지 30% 검증용 데이터로 데이터셋을 분할하고 검증하는 R Code 예시입니다.

 

> library(caret)
Loading required package: lattice
Loading required package: ggplot2
Find out what's changed in ggplot2 at
https://github.com/tidyverse/ggplot2/releases.

 

# iris data Species 기준으로 70% 훈련용 데이터로
#
나머지 30% 검증용 데이터로 데이터셋을 분할하기 위해
# createDataPartition()
함수를 사용하여 훈련데이터로 사용할 index 추출
# createDataPartition():
데이터를 훈련 데이터와 테스트 데이터로 분할하여 훈련 데이터로 사용할 데이터의 색인을 list 반환합니다.

> train.idx<-createDataPartition(iris$Species, p=0.7, list=F)

 

# 데이터의 색인list 확인
> head(train.idx)
     Resample1
[1,]         2
[2,]         3
[3,]         4
[4,]         5
[5,]         7
[6,]        11

 

# train.idx 통해 훈련데이터 생성
> iris_train<-iris[train.idx,]

# 훈련데이터 확인
> head(iris_train)
   Sepal.Length Sepal.Width Petal.Length
2           4.9         3.0          1.4
3           4.7         3.2          1.3
4           4.6         3.1          1.5
5           5.0         3.6          1.4
7           4.6         3.4          1.4
11          5.4         3.7          1.5
   Petal.Width Species
2          0.2  setosa
3          0.2  setosa
4          0.2  setosa
5          0.2  setosa
7          0.3  setosa
11         0.2  setosa

# iris_train 제외한 데이터로 테스트데이터 생성
> iris_test<-iris[-train.idx,]

 

# 테스트 데이터 확인
> head(iris_test)
   Sepal.Length Sepal.Width Petal.Length
1           5.1         3.5          1.4
6           5.4         3.9          1.7
8           5.0         3.4          1.5
9           4.4         2.9          1.4
10          4.9         3.1          1.5
25          4.8         3.4          1.9
   Petal.Width Species
1          0.2  setosa
6          0.4  setosa
8          0.2  setosa
9          0.2  setosa
10         0.1  setosa
25         0.2  setosa

# dim(): • 차원(dimension) 지정함수
#        • m x n 
차원의 행렬을 생성합니다.
# 105 x 5
차원의 행렬을 생성합니다.
> dim(iris_train)
[1] 105   5

 

# 45 x 5 차원의 행렬을 생성합니다.
> dim(iris_test)
[1] 45  5

>

 

https://codedragon.tistory.com/9580

https://codedragon.tistory.com/4970

https://codedragon.tistory.com/6783

https://codedragon.tistory.com/9933

https://codedragon.tistory.com/9493

 


'Development > Big Data, R, ...' 카테고리의 다른 글

데이터 분석 기법 선정  (0) 2020.01.15
공분산 값 의미  (0) 2020.01.15
R 코드 예시 - 데이터 분할  (0) 2020.01.15
3.Summary - 3.데이터 검증하기  (0) 2020.01.14
LOOCV(Leave-One-Out-Cross-Validation)  (0) 2020.01.14
모델이 복잡한 경우  (0) 2020.01.14
Posted by codedragon codedragon

댓글을 달아 주세요