groupby()

groupby()

CODEDRAGON ㆍDevelopment/Python

groupby()

· 데이터를 그룹 별로 분류하는 역할을 합니다.

· groupby() 반환값은 그룹 데이터를 나타내는 GroupBy 클래스 객체를 반환합니다.

· GroupBy 객체에는 그룹별로 연산을 할 수 있는 다양한 그룹 연산 메서드를 제공합니다.

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)

https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.DataFrame.groupby.html

그룹 연산 메서드

GroupBy 클래스 객체의 뒤에 붙일 수 있는 그룹 연산 메서드입니다.

메소드	설명
size()	· 갯수
count()	· 갯수
mean()	· 평균
median()	· 중앙값
min()	· 최소
max()	· 최대
sum()	· 합계
prod()	· 곱
std()	· 표준편차
var()	· 분산
quantile()	· 사분위수
first()	· 가장 첫번째 데이터
last()	· 가장 나중 데이터
agg() or aggregate()	· 원하는 그룹 연산이 없는 경우 함수를 만들고 이 함수명를 agg()에 전달합니다. · 여러가지 그룹 연산을 동시에 하고 싶은 경우 함수 이름 문자열의 리스트를 전달합니다.
describe()	· 하나의 그룹 대표값이 아니라 여러개의 값을 데이터프레임으로 구합니다. · 다양한 기술 통계(descriptive statistics)값을 한 번에 확인할 수 있습니다. · 그룹별로 하나의 스칼라 값이 아니라 여러 항목으로 구성된 하나의 데이터프레임이 생성된다는 점에 주의해야 합니다.
apply()	· describe() 처럼 하나의 대표값이 아닌 데이터프레임을 출력하지만 원하는 그룹 연산이 없는 경우에 사용합니다. · apply() 메서드를 사용하면 하나의 그룹에 대해 하나의 대표값(스칼라 값)을 구하는 게 아니라 describe() 메서드처럼 그룹별로 데이터프레임을 만들어 줍니다.
transform()	· 그룹에 대한 대표값을 만드는 것이 아니라 그룹별 계산을 통해 데이터 자체를 변형합니다. · transform() 메서드는 그룹별 대표값을 만드는 것이 아니라 그룹별 계산을 통해 데이터 값 자체를 반환시킵니다. 따라서 만들어진 데이터프레임의 크기는 원래 데이터프레임과 같습니다.

https://pandas.pydata.org/pandas-docs/stable/api.html#groupby

저작자표시 비영리 (새창열림)

'Development > Python' 카테고리의 다른 글

iris 컬럼 정보 (0)	2020.02.11
pivot_table() (0)	2020.02.11
그룹 분석 (0)	2020.02.11
피봇 테이블 생성 (0)	2020.02.11
swaplevel() (0)	2020.02.11

CodeDragon

CodeDragon

태그

최근글

댓글

공지사항

아카이브

'Development > Python' 카테고리의 다른 글

관련글

티스토리툴바