2020/01(266)
-
Python 데이터구조
Python 데이터구조 · 벡터(Vector), 행렬(Matrix), 배열(Array) 구분 없이 리스트(List) 데이터 구조만 있습니다. 리스트는 List와 tuple, set 형태로 구분되어져서 사용됩니다. · 배열을 사용하기 위해서는 넘파이(Numpy)의 array를 이용합니다. 리스트를 행과 열로 묶어서 사용할때 넘파이의 array를 사용합니다. · 데이터 프레임을 사용하기 위해서 판다스(pandas)의 데이터 프레임(Data Frame)을 이용합니다.
-
{NumPy}패키지의 기초 통계 분석 함수
{NumPy}패키지의 기초 통계 분석 함수 파이썬에서는 데이터 집합에 대해 간단한 기초 통계량(기술 통계)를 계산할 수 있는 함수를 제공합니다.
-
기초 통계량
기초 통계량· ≒ 기술 통계(descriptive statistics)· 데이터의 가장 기본적인 특징을 알려주는 값들입니다.· 기초 통계량은 데이터 개수, 표본 평균, 분산, 표준 편차, 다섯 수치 요약(최솟값, 중간값, 최댓값, 분위수), 최빈값 등이 사용됩니다.· 최대값, 최소값, 편차, 분산을 구하는 것은 데이터의 생김새를 볼수 있도록 해주며 이런 데이터 생김새를보고 의사결정을 하게 됩니다.
-
in1d(n, h)
in1d(n, h) · n의 엘리먼트가 h 안에 존재하는지 여부를 불 배열로 반환합니다. · n과 h 배열은 모양이 같지 않아도 됩니다. union1d() · 두 1차원 배열의 이론적인 합집합을 계산합니다. · 두 배열의 모양은 같지 않아도 됩니다. intersect1d() · 두 1차원 배열의 이론적인 교집합을 계산합니다. · 두 배열의 모양은 같지 않아도 됩니다.
-
unique() vs bincount()
unique() vs bincount()
-
중위수(Median), 중앙값 , 2사분위수
중위수(Median)· 중앙값 ≒ 중위수 ≒ 2사분위수 ≒ 2st Qu· 자료의 집단 전체를 데이터 크기대로 정렬하였을 때 가장 가운데(중앙)에 있는 수· 컬럼 데이터를 오름차순으로 정렬하여 가운데에 있는 값· n개의 자료를 크기 순으로 나열한 것중에서 가장 가운데 위치한 자료값· 데이터의 수가 짝수이면 가장 가운데에 있는 두 수의 평균을 사용합니다. http://bit.ly/2PpquNVhttp://bit.ly/2zbae9p 중위수 표현식