달력

3

« 2020/3 »

  • 29
  • 30
  • 31
  •  
  •  
  •  
  •  


 

R Code 예시 

 

R 통해 주어진 데이터를 통해 데이터 분석을 수행합니다.

성적과 IQ간의 회귀식을 구해서 IQ 125 사람의 성적을 예측하시오

 

학생별로 성적 IQ, 학원수, 게임하는 시간, TV 시청시간을 정리한 데이터입니다.

이름

성적

IQ

다니는 학원수

게임하는 시간

TV 시청시간

A

90

140

2

1

0

B

75

125

1

3

3

C

77

120

1

0

4

D

83

135

2

3

2

E

65

105

0

4

4

F

80

123

3

1

1

G

83

132

3

4

1

H

70

115

1

1

3

I

87

128

4

0

0

J

79

131

2

2

3

 

 

 

> # 현재 언어 설정 확인
> Sys.getlocale()
[1] "LC_COLLATE=English_United States.1252;LC_CTYPE=English_United States.1252;LC_MONETARY=English_United States.1252;LC_NUMERIC=C;LC_TIME=English_United States.1252"
> #
강제 언어 삭제
> Sys.setlocale("LC_ALL","C")
[1] "C"
> #
한글로 언어 설정
> Sys.setlocale("LC_ALL","Korean")
[1] "LC_COLLATE=Korean_Korea.949;LC_CTYPE=Korean_Korea.949;LC_MONETARY=Korean_Korea.949;LC_NUMERIC=C;LC_TIME=Korean_Korea.949"

 

 

# 데이터 불러오기

> s <- read.csv("IQ.csv", header=T, encoding="UTF-8")
> s
   이름 성적  IQ 다니는학원수 게임하는시간 TV시청시간
1     A   90 140            2            1          0
2     B   75 125            1            3          3
3     C   77 120            1            0          4
4     D   83 135            2            3          2
5     E   65 105            0            4          4
6     F   80 123            3            1          1
7     G   83 132            3            4          1
8     H   70 115            1            1          3
9     I   87 128            4            0          0
10    J   79 131            2            2          3

 

# 회귀분석 수행

> attach(s)
> lm1 <- lm(
성적~IQ)

# 회귀식 산출

> lm1

Call:
lm(formula =
성적 ~ IQ)

Coefficients:
(Intercept)           IQ 
    -5.2918       0.6714 

 

 

# IQ 125인 사람의 성적을 예측

> x <- 125
> x
[1] 125

 

 

#성적과 IQ간의 구한 회귀식을 통해 IQ 125인 사람의 성적을 예측

> y <- 0.6714*x+-5.2918
> y
[1] 78.6332

>

 

 

 

 

성적과 IQ간의 구한 회귀식은 아래와 같이나왔습니다.

Call:
lm(formula =
성적 ~ IQ)

Coefficients:
(Intercept)           IQ 
    -5.2918       0.6714 

 

성적과 IQ간의 구한 회귀식을 통해 IQ 125인 사람의 성적을 예측해 보면 78.63점이 나옵니다.

 

 

https://codedragon.tistory.com/9616

https://codedragon.tistory.com/9723

https://codedragon.tistory.com/9708

 

 

 

 

 

 

p-value 값과 통계적 의미

p-value

통계 의미

p-value가 작다

 

5%보다 작다

 

p-value < 0.05

귀무가설을 기각(reject)하고 대립가설을 채택(accept)한다

p-value가 크다

 

5%보다 크다

 

p-value > 0.05

귀무가설을 기각할 수 없으므로 대립가설을 기각(reject)한다.

, 귀무가설을 채택한다. 귀무가설에 95%의 신뢰를 준다.

 

 

https://codedragon.tistory.com/9668

https://codedragon.tistory.com/9872

https://codedragon.tistory.com/9747

 

'Development > Big Data, R, ...' 카테고리의 다른 글

분류 종류(분류 기법)  (0) 2020.01.22
Elbow Method  (0) 2020.01.22
3.Summary - 3.변수간 관계 확인하기  (0) 2020.01.22
인공신경망(ANN; Artificial Neural Network)  (0) 2020.01.21
5.Summary - 5. 모델성능 평가하기  (0) 2020.01.21
불순도(impurity)  (0) 2020.01.21
Posted by codedragon codedragon

댓글을 달아 주세요