Development/Python(798)
-
데이터프레임 병합
데이터프레임 병합 Pandas는 두 개 이상의 데이터프레임을 하나로 합치는 데이터 병합(merge)이나 데이터 연결(concatenate)을 할 수 있습니다.
-
set vs dictionary vs list vs tuple
set vs dictionary vs list vs tuple
-
numpy.argsort()
numpy.argsort() 해당 데이터셋에서 크기가 작은 값부터 순서대로 데이터의 index를 반환해주는 함수입니다. (index는 0부터 시작합니다.)
-
리터럴을 통한 dict 생성, dict() 생성자를 통한 dict생성
리터럴을 통한 dict 생성· Dictionary는 "dict" 클래스로 구현되어 있습니다.· Key와 Value의 쌍 여러 개가 {과 }로 감싸져 있습니다.· Dictionary의 키(key)는 그 값을 변경할 수 없는 Immutable 타입이어야 하며, Dictionary 값(value)은 Immutable과 Mutable 모두 가능합니다.· 각각의 요소는 Key : Value 형태로 이루어져 있으며 각 요소는 쉼표(,) 로 구분되어 집니다.· 딕셔너리에 있는 Key는 고유한 값이므로 중복되는 Key 값을 설정해 놓으면 하나를 제외한 나머지 것들은 모두 무시됩니다. (어떤 것이 무시될지는 예측할 수 없습니다.)· Key에 리스트(list)는 쓸 수 없지만 튜플(tuple)은 Key로 쓸 수 있습니다...
-
bincount()
bincount() · unique() 함수는 데이터에 존재하는 값에 대해서만 갯수를 세므로 데이터 값이 나올 수 있음에도 불구하고 해당 데이터가 하나도 없는 경우에는 출력되지 않습니다. · 예를 들면, 주사위를 10번 던졌을 때 5가 한 번도 나오지 않으면 이 값은 0이므로 출력이 되지 않습니다. 이경우에도 0으로 처리된 값을 출력할 수 있습니다. · 특정 범위안의 수를 모두 표시하고자 할 경우에는 bincount()함수와 minlength 인자를 설정하여 사용하면 됩니다. 그러면 0 부터 minlength - 1 까지의 숫자에 대해 각각 카운트한 결과를 반환하며 카운트한 값이 없는 데이터는 0이 출력되게 됩니다.
-
np.percentile()
np.percentile() 사분위수(quartile)에 해당하는 값을 출력할 수 있습니다. 다섯 수치 요약(5 number summary)에 대한 값 알아내기