2020/02/07(13)
-
데이터프레임 열 인덱싱
데이터프레임 열 인덱싱· 데이터프레임을 인덱싱을 할 때 열 라벨(column label)을 키값으로 생각하고 인덱싱을 하면 됩니다.· 인덱스로 라벨 값을 하나만 넣으면 시리즈(Series) 객체가 반환되고 라벨의 배열 또는 리스트를 넣으면 부분적인 데이터프레임(DataFrame)이 반환됩니다.· 하나의 열만 가져오면서 데이터프레임 자료형을 유지하고 싶다면 원소가 하나인 리스트를 써서 인덱싱하면 됩니다.
-
iloc indexer
iloc indexer · loc 인덱서와 반대 · 라벨이 아니라 순서를 나타내는 인덱스 정수(integer) 기반의 2차원 인덱싱을 합니다.
-
lm()
lm() · lm(linear mode) · 회귀분석분석 수행 함수 · 상관분석을 실시한 결과를 이용해 가장 높은 유의성을 갖는 변수가 데이터 사용량에 미치는 영향을 추정하기 위해 단순회귀분석을 수행합니다. · 회귀직선(선형회귀)를 그리는 함수로 반환값은 lm의 객체입니다. · 단순 선형회귀를 기준으로 y=a + bx라는 회귀함수(회귀곡선)을 구하여 독립변수(x)에 따른 종속변수(y)값을 예측하는 모델링입니다. 인자 설명 formula · 포뮬러 · 종속변수~독립변수 data · 포뮬러를 적용할 데이터 · 보통 데이터 프레임 subset weights na.action · NA가 포함된 행을 다루는 방법을 설정합니다. · na.fail · na.omit · na.exclude method = "qr" m..
-
가설 검정의 오류
가설 검정의 오류통계적인 방법에 근거하여 주어진 가설을 검증하는 데 있어 모집단 전체를 통해 검증하는 것이 아닌 모집단으로부터 추출된 표본을 기반으로 모집단에 대한 결론을 내리는 것이기 때문에 다음과 같은 통계적인 오류가 발생할 가능성이 항상 존재합니다. · 제1종 오류· 제2종 오류 제1종 오류귀무가설이 참인데 잘못하여 이를 기각하게 되는 오류를 제1종 오류라고 합니다. 제2종 오류귀무가설이 참이 아닌데 잘못하여 이를 채택하게 되는 오류를 제2종 오류라고 합니다.
-
유의수준(significance level; α), 귀무가설(H0)과 대립가설(H1)의 채택
유의수준(significance level; α)· ≒ level of significance· 계산된 유의 확률 값에 대해 귀무 가설을 기각하는지 채택하는지를 결정할 수 있는 기준 값입니다.· p-value를 크다, 작다로 나누는 기준입니다.· 유의수준의 값은 기호 α로 표시합니다.· 가설검정 시, 허용 가능한 1종 오류의 최대치입니다.· 연구자가 세운 대립가설의 채택 여부를 판단하는 기준입니다.· 기준값인 유의수준(α)보다 작으면 귀무가설이 나올 가능성이 적다고 판단하여 귀무가설을 기각(reject)합니다.· 유의수준으로는 0.05(5%), 0.01(1%), 0.1(10%)중 한 개의 값을 사용하는데 보통 0.05가 사용됩니다. 즉, p-value가 5%보다 크다면 귀무가설을 채택합니다. 이는 곧 귀..
-
확률분포 메서드
확률분포 메서드확률분포 객체가 가지는 메서드입니다.