달력

12

« 2019/12 »



 

 

리스트 슬라이싱(Slicing)

·         전체 리스트에서 일부 요소들을 선택하기 위하여 슬라이스(Slice) 사용합니다.

·         슬라이스는 인덱스 표현으로 부분집합의 범위를 지정합니다.

·         인덱스는 0 부터 시작하며, 마지막 인덱스는 원하는 "마지막 요소의 인덱스 + 1" 의미합니다.(마지막인덱스의 요소는 포함되지 않습니다.)

·         처음인덱스가 생략되면 0 부터 시작되며, 마지막 인덱스가 생략되면, 리스트의 끝까지 포함하게 됩니다.

 

 

list[처음인덱스:마지막인덱스]

 

 


'Development > Python' 카테고리의 다른 글

파일 입출력 관련 함수들  (0) 2019.12.27
NumPy Reference, NumPy Manual  (0) 2019.12.26
리스트 슬라이싱(Slicing)  (0) 2019.12.25
비트연산자(Bitwise 연산자)  (0) 2019.12.25
Anaconda - download (다운로드)  (0) 2019.12.24
논리 연산자(logical operator)  (0) 2019.12.24
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

평활(smoothing)

데이터 집합에 존재하는 잡음으로 인해 거칠게 분포된 데이터를 매끄럽게 만드는 방법입니다.

 

 

 


'Development > Big Data, R, ...' 카테고리의 다른 글

4.Summary - 4. 자율모델 적용하기  (0) 2019.12.26
createDataPartition()  (0) 2019.12.26
평활(smoothing)  (0) 2019.12.25
2.Summary - 2. 데이터 세트 분할하기  (0) 2019.12.25
dplyr 패키지  (0) 2019.12.24
p-value 값  (0) 2019.12.24
Posted by codedragon codedragon

댓글을 달아 주세요


 

R 코드 예시 - 데이터 분할

{caret} Package createDataPartition()함수를 사용하여 iris data Species 기준으로 70% 훈련용 데이터로 나머지 30% 검증용 데이터로 데이터셋을 분할하고 검증하는 R Code 예시입니다.

 

> library(caret)
Loading required package: lattice
Loading required package: ggplot2
Find out what's changed in ggplot2 at
https://github.com/tidyverse/ggplot2/releases.

 

# iris data Species 기준으로 70%는 훈련용 데이터로
#
나머지 30%는 검증용 데이터로 데이터셋을 분할하기 위해
# createDataPartition()
함수를 사용하여 훈련데이터로 사용할 index 추출
# createDataPartition():
데이터를 훈련 데이터와 테스트 데이터로 분할하여 훈련 데이터로 사용할 데이터의 색인을 list로 반환합니다.

> train.idx<-createDataPartition(iris$Species, p=0.7, list=F)

 

# 데이터의 색인list 확인
> head(train.idx)
     Resample1
[1,]         2
[2,]         3
[3,]         4
[4,]         5
[5,]         7
[6,]        11

 

# train.idx를 통해 훈련데이터 생성
> iris_train<-iris[train.idx,]

# 훈련데이터 확인
> head(iris_train)
   Sepal.Length Sepal.Width Petal.Length
2           4.9         3.0          1.4
3           4.7         3.2          1.3
4           4.6         3.1          1.5
5           5.0         3.6          1.4
7           4.6         3.4          1.4
11          5.4         3.7          1.5
   Petal.Width Species
2          0.2  setosa
3          0.2  setosa
4          0.2  setosa
5          0.2  setosa
7          0.3  setosa
11         0.2  setosa

# iris_train를 제외한 데이터로 테스트데이터 생성
> iris_test<-iris[-train.idx,]

 

# 테스트 데이터 확인
> head(iris_test)
   Sepal.Length Sepal.Width Petal.Length
1           5.1         3.5          1.4
6           5.4         3.9          1.7
8           5.0         3.4          1.5
9           4.4         2.9          1.4
10          4.9         3.1          1.5
25          4.8         3.4          1.9
   Petal.Width Species
1          0.2  setosa
6          0.4  setosa
8          0.2  setosa
9          0.2  setosa
10         0.1  setosa
25         0.2  setosa

# dim(): • 차원(dimension) 지정함수
#        • m x n 
차원의 행렬을 생성합니다.
# 105 x 5
차원의 행렬을 생성합니다.
> dim(iris_train)
[1] 105   5

 

# 45 x 5 차원의 행렬을 생성합니다.
> dim(iris_test)
[1] 45  5

>

 

https://codedragon.tistory.com/9897

 

'Development > Big Data, R, ...' 카테고리의 다른 글

createDataPartition()  (0) 2019.12.26
평활(smoothing)  (0) 2019.12.25
2.Summary - 2. 데이터 세트 분할하기  (0) 2019.12.25
dplyr 패키지  (0) 2019.12.24
p-value 값  (0) 2019.12.24
2.Summary - 2.빅데이터 수집 시스템 구성하기  (0) 2019.12.24
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

비트연산자(Bitwise 연산자)

비트단위의 연산을 하는데 사용되는 기호입니다.

 

 

연산자

설명

&

AND

|

OR

^

XOR

~

Complement

<< 

Left Shift

>> 

Right Shift

 

 


'Development > Python' 카테고리의 다른 글

NumPy Reference, NumPy Manual  (0) 2019.12.26
리스트 슬라이싱(Slicing)  (0) 2019.12.25
비트연산자(Bitwise 연산자)  (0) 2019.12.25
Anaconda - download (다운로드)  (0) 2019.12.24
논리 연산자(logical operator)  (0) 2019.12.24
str()  (0) 2019.12.23
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

전자정부 표준 프레임워크 개발 가이드 Manual

http://www.egovframe.go.kr/wiki/doku.php?id=start

 


 



Posted by codedragon codedragon

댓글을 달아 주세요