전체 글(14828)
-
개별 데이터 인덱싱
개별 데이터 인덱싱데이터프레임에서 열 라벨(column label)로 시리즈(Series)를 인덱싱하고 다시 행 라벨(row label)로 개별 데이터를 인덱싱할 수 있습니다.
-
정수 인덱스 사용
정수 인덱스 사용 · 정수 인덱스 사용 가능 · 정수 인덱스 사용시 ERROR 정수 인덱스 사용 가능 생성시 문자열로 된 열 라벨이 주어지지 않아서 정수형 열 인덱스가 만들어진 경우에는 인덱스 정수를 사용할 수 있습니다. 정수 인덱스 사용시 ERROR - 문자열 라벨을 지정한 경우 데이터프레임의 열 인덱스(column index)가 문자열 라벨을 가지고 있는 경우에는 순서를 나타내는 정수 인덱스를 열 인덱싱에 사용할 수 없습니다. 정수 인덱스를 넣으면 오류가 발생합니다.
-
데이터프레임 열 인덱싱
데이터프레임 열 인덱싱· 데이터프레임을 인덱싱을 할 때 열 라벨(column label)을 키값으로 생각하고 인덱싱을 하면 됩니다.· 인덱스로 라벨 값을 하나만 넣으면 시리즈(Series) 객체가 반환되고 라벨의 배열 또는 리스트를 넣으면 부분적인 데이터프레임(DataFrame)이 반환됩니다.· 하나의 열만 가져오면서 데이터프레임 자료형을 유지하고 싶다면 원소가 하나인 리스트를 써서 인덱싱하면 됩니다.
-
iloc indexer
iloc indexer · loc 인덱서와 반대 · 라벨이 아니라 순서를 나타내는 인덱스 정수(integer) 기반의 2차원 인덱싱을 합니다.
-
lm()
lm() · lm(linear mode) · 회귀분석분석 수행 함수 · 상관분석을 실시한 결과를 이용해 가장 높은 유의성을 갖는 변수가 데이터 사용량에 미치는 영향을 추정하기 위해 단순회귀분석을 수행합니다. · 회귀직선(선형회귀)를 그리는 함수로 반환값은 lm의 객체입니다. · 단순 선형회귀를 기준으로 y=a + bx라는 회귀함수(회귀곡선)을 구하여 독립변수(x)에 따른 종속변수(y)값을 예측하는 모델링입니다. 인자 설명 formula · 포뮬러 · 종속변수~독립변수 data · 포뮬러를 적용할 데이터 · 보통 데이터 프레임 subset weights na.action · NA가 포함된 행을 다루는 방법을 설정합니다. · na.fail · na.omit · na.exclude method = "qr" m..
-
가설 검정의 오류
가설 검정의 오류통계적인 방법에 근거하여 주어진 가설을 검증하는 데 있어 모집단 전체를 통해 검증하는 것이 아닌 모집단으로부터 추출된 표본을 기반으로 모집단에 대한 결론을 내리는 것이기 때문에 다음과 같은 통계적인 오류가 발생할 가능성이 항상 존재합니다. · 제1종 오류· 제2종 오류 제1종 오류귀무가설이 참인데 잘못하여 이를 기각하게 되는 오류를 제1종 오류라고 합니다. 제2종 오류귀무가설이 참이 아닌데 잘못하여 이를 채택하게 되는 오류를 제2종 오류라고 합니다.