CODEDRAGON ㆍDevelopment/Python
groupby()
· 데이터를 그룹 별로 분류하는 역할을 합니다.
· groupby() 반환값은 그룹 데이터를 나타내는 GroupBy 클래스 객체를 반환합니다.
· GroupBy 객체에는 그룹별로 연산을 할 수 있는 다양한 그룹 연산 메서드를 제공합니다.
DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs) |
https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.DataFrame.groupby.html
그룹 연산 메서드
GroupBy 클래스 객체의 뒤에 붙일 수 있는 그룹 연산 메서드입니다.
메소드 |
설명 |
size() |
· 갯수 |
count() |
· 갯수 |
mean() |
· 평균 |
median() |
· 중앙값 |
min() |
· 최소 |
max() |
· 최대 |
sum() |
· 합계 |
prod() |
· 곱 |
std() |
· 표준편차 |
var() |
· 분산 |
quantile() |
· 사분위수 |
first() |
· 가장 첫번째 데이터 |
last() |
· 가장 나중 데이터 |
agg() or aggregate() |
· 원하는 그룹 연산이 없는 경우 함수를 만들고 이 함수명를 agg()에 전달합니다. · 여러가지 그룹 연산을 동시에 하고 싶은 경우 함수 이름 문자열의 리스트를 전달합니다. |
describe() |
· 하나의 그룹 대표값이 아니라 여러개의 값을 데이터프레임으로 구합니다. · 다양한 기술 통계(descriptive statistics)값을 한 번에 확인할 수 있습니다. · 그룹별로 하나의 스칼라 값이 아니라 여러 항목으로 구성된 하나의 데이터프레임이 생성된다는 점에 주의해야 합니다. |
apply() |
· describe() 처럼 하나의 대표값이 아닌 데이터프레임을 출력하지만 원하는 그룹 연산이 없는 경우에 사용합니다. · apply() 메서드를 사용하면 하나의 그룹에 대해 하나의 대표값(스칼라 값)을 구하는 게 아니라 describe() 메서드처럼 그룹별로 데이터프레임을 만들어 줍니다. |
transform() |
· 그룹에 대한 대표값을 만드는 것이 아니라 그룹별 계산을 통해 데이터 자체를 변형합니다. · transform() 메서드는 그룹별 대표값을 만드는 것이 아니라 그룹별 계산을 통해 데이터 값 자체를 반환시킵니다. 따라서 만들어진 데이터프레임의 크기는 원래 데이터프레임과 같습니다. |
https://pandas.pydata.org/pandas-docs/stable/api.html#groupby
'Development > Python' 카테고리의 다른 글
iris 컬럼 정보 (0) | 2020.02.11 |
---|---|
pivot_table() (0) | 2020.02.11 |
그룹 분석 (0) | 2020.02.11 |
피봇 테이블 생성 (0) | 2020.02.11 |
swaplevel() (0) | 2020.02.11 |