Development/Big Data, R, ...(885)
-
F 분포
F 분포 · 두 개의 분산에 관한 추론입니다. · 독립적인 카이제곱 변수들이 해당되는 자유도에 의해 나눠진 값의 비율에 의한 분포입니다. · 비교집단이 3개 이상인 경우 사용됩니다. · 대표적으로 분산분석에 사용되는 분포입니다. · 두 개 이상의 집단을 비교할 때, 집단 내의 분산, 집단 간의 분산의 비교를 통해 생성된 F비를 이용하여 검정을 시행합니다. · 다수 집단에 평균치 차이가 있는지 유의성 판단을 할 수 있습니다.
-
분산(var; variance)
분산(var; variance)· ≒ 샘플 분산(sample variance)· 1개의 변수의 이산정도를 나타내는 값· 분산은 데이터의 퍼짐을 측정한 값 혹은 평균으로 부터 데이터가 얼마나 떨어져 있는가를 측정한 값· 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 숫자· 데이터와 샘플 평균간의 거리의 제곱의 평균· 기댓값은 확률변수의 위치를 나타내고 분산은 그것이 얼마나 넓게 퍼져 있는지를 나타냅니다. · 분산이 작으면↓ 데이터가 모여있는 것이고 크면↑ 흩어져 있는 것을 의미합니다.· 수학 기호로는 s2 로 표시합니다.· 분산보다는 분산의 제곱근인 표준편차가 더 자주 사용됩니다. https://ko.wikipedia.org/wiki/%EB%B6%84%EC%82%B0https://nam..
-
카이 제곱 분포(Chi-Squared Distribution)
카이 제곱 분포(Chi-Squared Distribution) · ≒ x2분포 · 실제로 관찰된 빈도가 기대빈도와 얼마나 근접한지를 검정할 때 사용합니다. · 주로 명목척도로 측정된 두 변수간의 상관관계를 검정할 때 사용합니다. · 표본분포로 자유도에 의해 구체적인 분포가 결정됩니다. · 자유도(degree of freedom)라는 하나의 파라미터를 가지며, 이 파라미터에 따라 분포의 모양이 달라집니다.
-
자유도(degrees of freedom)
자유도(degrees of freedom) · 통계적 추정을 할 때 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수를 말하며 · 추정해야 할 미지수의 개수를 내가 가진 정보의 수에서 뺀 값을 의미합니다. · 표준편차나 분산을 구할 때 자유도가 n-1인 이유는, 내가 가진 정보의 수는 n이고 내가 추정해야 할 미지수는 모집단 평균 1개가 되므로 n-1이 됩니다. http://bit.ly/3btYtMy http://bit.ly/38l0g4F 숫자 5개의 평균이 3이 되어야 하는 조건
-
t 통계량
t 통계량가우시안 정규 분포(Gaussian normal distribution)로부터 얻은 N 개의 표본 x1,⋯,xN 에서 계산한 표본평균을 표본표준편차로 정규화한 값을 t 통계량이라고 합니다.
-
다항 분포(Multinomial distribution)
다항 분포(Multinomial distribution) 독립적인 카테고리 분포를 여러번 시도하여 얻은 각 원소의 성공횟수 값들이 다항 분포가 됩니다.