CODEDRAGON ㆍDevelopment/Big Data, R, ...
정규 분포(Normal Distribution)
· ≒ 가우스 분포 ≒ 가우시안 정규 분포(Gaussian normal distribution)
· 모든 값을 표현하기에 최대/최소값 없이 무한대로 표현이 가능한 분포입니다.
· 자연 현상에서 나타나는 숫자를 확률 모형으로 모형화할 때 많이 사용합니다.
표준 정규 분포(standard normal distribution)
정규 분포 중에서도 평균이 0 이고 분산이 1 인 ( μ=0 , σ2=1 ) 정규 분포를 말합니다.
'정규분포를 따른다'는 의미
· 통계에서 '정규분포를 따른다'것은 매우 중요합니다.
· 동전을 던지거나 주사위를 던질 때 정규분포를 따르며 '일반적인 모델'이라는 의미입니다.
정규 분포 표현
정규분포는 2개의 매개 변수 평균(μ)과 표준편차 (σ) 에 의해 모양이 결정됩니다.
정규 분포는 평균(μ)과 분산(σ2)의 두 개 파라미터를 가지며 N(μ, σ2)로 표현합니다.
정규 분포의 범위
정규 분포이기 때문에 특정 범위에 포함되는 값의 비율을 정확히 알 수 있습니다.
관측치의 약 95%가 파란색 음영 영역으로 표시된 평균의 2 표준 편차에 해당합니다. 값의 95%는 평균의 1.96 표준 편차 내(1.96과 +1.96 사이)에 있습니다. 따라서 관측치의 5%(0.05) 미만이 이 범위의 바깥에 있습니다. 이 범위를 바탕으로 많은 가설 검정에서 알파 수준으로 0.05가 사용됩니다.
관측치의 약 68%가 평균에서 1 표준 편차(-1 ~ +1)에 해당합니다.
관측치의 약 99.7%는 평균의 3 표준 편차(-3 ~ +3)에 해당합니다.
정규 분포 히스토그램
'Development > Big Data, R, ...' 카테고리의 다른 글
기초 통계량 (0) | 2020.01.31 |
---|---|
중위수(Median), 중앙값 , 2사분위수 (0) | 2020.01.31 |
머신러닝 vs 통계학 (0) | 2020.01.30 |
데이터 분석용 파이썬 패키지 (0) | 2020.01.30 |
강화학습 도식도 (0) | 2020.01.30 |