Development/Python(797)
-
DatetimeIndex()
DatetimeIndex() · DatetimeIndex() 메소드는 특정한 순간에 기록된 타임스탬프(timestamp) 형식의 시계열 자료를 다루기 위한 인덱스를 만들어줄때 사용합니다. · 타임스탬프 인덱스의 라벨값이 반드시 일정한 간격일 필요는 없습니다. parameter description dtype data type freq 특정한 날짜만 생성되도록 시계열 데이터의 형식 지정 보조함수 설명 pd.to_datetime() 날짜/시간을 나타내는 문자열을 자동으로 datetime 자료형으로 바꾼 후 DatetimeIndex 자료형 인덱스를 생성합니다. pd.date_range() 모든 날짜/시간을 일일히 입력할 필요없이 시작일과 종료일 또는 시작일과 기간을 입력하면 범위 내의 인덱스를 생성합니다.
-
시계열 데이터 다루기
시계열 데이터 다루기
-
iris 컬럼 정보
iris 컬럼 정보
-
pivot_table()
pivot_table()groupby() 메소드처럼 그룹 분석을 하지만 pivot()메소드처럼 피봇테이블을 만들어줍니다. 인자 설명 data · 분석할 데이터프레임 · pivot_table() 멤버메서드로 사용할 때는 객체 자체가 데이터가 되므로 data 인수가 필요하지 않습니다. values · 분석할 데이터프레임에서 분석할 열 index · 행 인덱스로 들어갈 키 열 또는 키 열의 리스트 columns · 열 인덱스로 들어갈 키 열 또는 키 열의 리스트 aggfunc · 분석 메서드 · 만약 조건에 따른 데이터가 유일하게 선택되지 않으면 그룹 연산을 하며 이 때 aggfunc 인수로 정의된 함수를 수행하여 대표값을 계산합니다. fill_value · NaN 대체 값 margins · 오른쪽과 아래에 ..
-
groupby()
groupby() · 데이터를 그룹 별로 분류하는 역할을 합니다. · groupby() 반환값은 그룹 데이터를 나타내는 GroupBy 클래스 객체를 반환합니다. · GroupBy 객체에는 그룹별로 연산을 할 수 있는 다양한 그룹 연산 메서드를 제공합니다. 메소드 설명 size() · 갯수 count() · 갯수 mean() · 평균 median() · 중앙값 min() · 최소 max() · 최대 sum() · 합계 prod() · 곱 std() · 표준편차 var() · 분산 quantile() · 사분위수 first() · 가장 첫번째 데이터 last() · 가장 나중 데이터 agg() or aggregate() · 원하는 그룹 연산이 없는 경우 함수를 만들고 이 함수명를 agg()에 전달합니다. ·..
-
그룹 분석
그룹 분석 · 특정 조건에 맞는 데이터가 하나 이상 즉, 그룹을 이루는 경우애는 그룹 분석을 할 수 있습니다. · 피봇 테이블은 행 인덱스와 열 인덱스는 유일하게(unique) 키로 결정되어야 하는 데 이와 달리 키에 의해서 결정되는 데이터가 여러개가 있어도 괜찮습니다. · 그룹 분석은 주어진 연산을 통해 그룹 데이터의 대표값을 정하게 됩니다. Pandas 그룹 분석 Pandas에서는 groupby()메소드와 그룹 연산 메서드를 이용하여 그룹 분석을 수행합니다.