groupby()

CODEDRAGON Development/Python

반응형


 

 

groupby()

·       데이터를 그룹 별로 분류하는 역할을 합니다.

·       groupby() 반환값은 그룹 데이터를 나타내는 GroupBy 클래스 객체를 반환합니다.

·       GroupBy 객체에는 그룹별로 연산을 할 수 있는 다양한 그룹 연산 메서드를 제공합니다.

 

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)

 


 

 

https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.DataFrame.groupby.html

 

 

 

 

 

그룹 연산 메서드

GroupBy 클래스 객체의 뒤에 붙일 수 있는 그룹 연산 메서드입니다.

 

메소드

설명

size()

·       갯수

count()

·       갯수

mean()

·       평균

median()

·       중앙값

min()

·       최소

max()

·       최대

sum()

·       합계

prod()

·      

std()

·       표준편차

var()

·       분산

quantile()

·       사분위수

first()

·       가장 첫번째 데이터

last()

·       가장 나중 데이터

agg()

or

aggregate()

·       원하는 그룹 연산이 없는 경우 함수를 만들고 이 함수명를 agg()에 전달합니다.

·       여러가지 그룹 연산을 동시에 하고 싶은 경우 함수 이름 문자열의 리스트를 전달합니다.

describe()

·       하나의 그룹 대표값이 아니라 여러개의 값을 데이터프레임으로 구합니다.

·       다양한 기술 통계(descriptive statistics)값을 한 번에 확인할 수 있습니다.

·       그룹별로 하나의 스칼라 값이 아니라 여러 항목으로 구성된 하나의 데이터프레임이 생성된다는 점에 주의해야 합니다.

apply()

·       describe() 처럼 하나의 대표값이 아닌 데이터프레임을 출력하지만 원하는 그룹 연산이 없는 경우에 사용합니다.

·       apply() 메서드를 사용하면 하나의 그룹에 대해 하나의 대표값(스칼라 값)을 구하는 게 아니라 describe() 메서드처럼 그룹별로 데이터프레임을 만들어 줍니다.

transform()

·       그룹에 대한 대표값을 만드는 것이 아니라 그룹별 계산을 통해 데이터 자체를 변형합니다.

·       transform() 메서드는 그룹별 대표값을 만드는 것이 아니라 그룹별 계산을 통해 데이터 값 자체를 반환시킵니다. 따라서 만들어진 데이터프레임의 크기는 원래 데이터프레임과 같습니다.

 

https://pandas.pydata.org/pandas-docs/stable/api.html#groupby

 



반응형

'Development > Python' 카테고리의 다른 글

iris 컬럼 정보  (0) 2020.02.11
pivot_table()  (0) 2020.02.11
그룹 분석  (0) 2020.02.11
피봇 테이블 생성  (0) 2020.02.11
swaplevel()  (0) 2020.02.11