3.Summary - 3.빅데이터 분석모듈 개발하기

CODEDRAGON Development/Big Data, R, ...

반응형



 

R Code 예시 1

R 통해 아래의 데이터를 그래프로 시각화하는 코드 예시입니다.

 

baseBall = c(260, 300, 250, 280, 310)

soccerBall = c(180, 200, 210, 190, 170)

beachBall = c(210, 250, 260, 210, 270)

 


 

 

 

 

#데이터 생성

> baseBall = c(260, 300, 250, 280, 310)
> soccerBall = c(180, 200, 210, 190, 170)
> beachBall = c(210, 250, 260, 210, 270)

 

# 그래프 생성

> plot(baseBall, type = "o", col = "red", ylim = c(0, 400), axes = F, ann = F)

 

# x y 설정

> axis(1, at = 1:5, lab = c("A", "B", "C", "D", "E"))
> axis(2, ylim = c(0, 400))

 

# 레이블 지정

> title(main = "Fruit", col.main = "red", font.main = 4)
> title(xlab = "Day", col.lab = "black")
> title(ylab = "Price", col.lab = "blue")

 

# 라인 지정

> lines(soccerBall, type = "o", pch = 21, col = "green", lty = 2)
> lines(beachBall, type = "o", pch = 22, col = "blue", lty = 2)

 

# 범례 지정

> legend(4, 400, c("BaseBall", "SoccerBall", "BeachBall"), cex = 0.8, col = c("Red", "Green", "Blue"), pch = 21, lty = 1: 3)

>

 

 

https://codedragon.tistory.com/4981

https://codedragon.tistory.com/9721

https://codedragon.tistory.com/9391

https://codedragon.tistory.com/9501

https://codedragon.tistory.com/9691

https://codedragon.tistory.com/9706

 

 

 

 

 

 

 

R Code 예시 2

 

R 통해 주어진 데이터를 통해 데이터 분석을 수행합니다.

성적과 IQ간의 회귀식을 구해서 IQ 125 사람의 성적을 예측하시오

 

학생별로 성적 IQ, 학원수, 게임하는 시간, TV 시청시간을 정리한 데이터입니다.

이름

성적

IQ

다니는 학원수

게임하는 시간

TV 시청시간

A

90

140

2

1

0

B

75

125

1

3

3

C

77

120

1

0

4

D

83

135

2

3

2

E

65

105

0

4

4

F

80

123

3

1

1

G

83

132

3

4

1

H

70

115

1

1

3

I

87

128

4

0

0

J

79

131

2

2

3

 

 

 

> # 현재 언어 설정 확인
> Sys.getlocale()
[1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252"
> #
강제 언어 삭제
> Sys.setlocale("LC_ALL","C")
[1] "C"
> #
한글로 언어 설정
> Sys.setlocale("LC_ALL","Korean")
[1] "LC_COLLATE=Korean_Korea.949;LC_CTYPE=Korean_Korea.949;LC_MONETARY=Korean_Korea.949;LC_NUMERIC=C;LC_TIME=Korean_Korea.949"

 

 

# 데이터 불러오기

> s <- read.csv("IQ.csv", header=T, encoding="UTF-8")
> s
   이름 성적  IQ 다니는학원수 게임하는시간 TV시청시간
1     A   90 140            2            1          0
2     B   75 125            1            3          3
3     C   77 120            1            0          4
4     D   83 135            2            3          2
5     E   65 105            0            4          4
6     F   80 123            3            1          1
7     G   83 132            3            4          1
8     H   70 115            1            1          3
9     I   87 128            4            0          0
10    J   79 131            2            2          3

 

# 회귀분석 수행

> attach(s)
> lm1 <- lm(
성적~IQ)

# 회귀식 산출

> lm1

Call:
lm(formula =
성적 ~ IQ)

Coefficients:
(Intercept)           IQ 
    -5.2918       0.6714 

 

 

# IQ 125 사람의 성적을 예측

> x <- 125
> x
[1] 125

 

 

#성적과 IQ간의 구한 회귀식을 통해 IQ 125 사람의 성적을 예측

> y <- 0.6714*x+-5.2918
> y
[1] 78.6332

>

 

 

 

 

성적과 IQ간의 구한 회귀식은 아래와 같이나왔습니다.

Call:
lm(formula =
성적 ~ IQ)

Coefficients:
(Intercept)           IQ 
    -5.2918       0.6714 

 

성적과 IQ간의 구한 회귀식을 통해 IQ 125 사람의 성적을 예측해 보면 78.63점이 나옵니다.

 

https://codedragon.tistory.com/9616

https://codedragon.tistory.com/9723

 


반응형

'Development > Big Data, R, ...' 카테고리의 다른 글

공공 인공지능 오픈 API·DATA 서비스 포털  (0) 2019.12.17
SC-FEGAN  (0) 2019.12.16
클래스 불균형(Class Imbalance)  (0) 2019.12.15
VoVNet  (0) 2019.12.15
5.Summary - 5.이벤트처리 수행모듈 개발하기  (0) 2019.12.15