2020/01/29(7)
-
데이터 교정
데이터 교정 비정형 데이터를 수집하는 경우 반드시 수행해야 합니다. · 결측치 변환, · 이상치 제거, · 노이즈 데이터 교정, · 누락된 값 채우기, · 데이터 문자 정리
-
numpy 불린 인덱싱 (boolean indexing)
numpy 불린 인덱싱 (boolean indexing) · ≒ 불리안(Boolean) 배열 방식 · numpy 불린 인덱싱은 배열 각 요소의 선택여부를 True, False로 표현합니다. · 인덱스 배열의 원소가 True, False 두 값으로만 구성되며 인덱스 배열의 크기가 원래 ndarray 객체의 크기와 같아야 합니다. · 불린 값으로 된 배열을 인덱스로 사용하면 대상 배열의 인덱스가 True인 아이템만 결과로 추출할 수 있습니다. numpy 불린 인덱싱 방법 · True/False 값으로 불린 인덱싱 배열 · 표현식을 사용하여 불린 인덱싱 배열을 생성 True/False 값으로 불린 인덱싱 배열 만약 배열 a 가 2 x 3 의 배열이이라면, 불린 인덱싱을 정의하는 numpy 배열도 2 x 3 으..
-
리스트 내장(리스트 내포; List comprehension) 형식
리스트 내포 형식 · for문과 유사 · 수행할 문장을 for키워드 앞에 정의하고 아이템을 선별하기위해 if조건식을 사용할 수 있지만 생략 가능합니다. [ for in (if )] for문 2개 이상 사용하기
-
다중 공선성(multicollinarity)
다중 공선성(multicollinarity) · 다중 공선성은 회귀 모델에서 변수 간의 상관관계가 커서 한 변수를 다른 변수들의 선형 조합으로 손쉽게 예측할 수 있는 경우를 뜻합니다. · 다중공선성은 회귀계수의 분산을 증가시킵니다. · 다중 공선성이 존재하면 회귀모델 계수 β0, β1, β2, …, βp의 추정이 어려워집니다. 다중 공선성 예 Xi1 = aXi2 + bXi3이 성립한다면 선형 회귀 식에서 Xi1 변수의 사용이 무의미해지기 때문입니다. http://bit.ly/38giIf4 https://en.wikipedia.org/wiki/Multicollinearity
-
F1지표(F1 score) 예시 2
F1지표(F1 score) 예시 2 F1 score on multiclass classification Step by Step· Recall - MODEL 1· Precision - MODEL 1· F1 score - MODEL 1· Recall - MODEL 2· Precision - MODEL 2· F1 score - MODEL 2· F1 score Comparison MODEL 1 Recall - MODEL 1 index TP FP Recall A 110 110 110/220=0.5 B 9 1 9/10=0.9 C 8 2 8/10=0.8 D 9 1 9/10=0.9 A, B, C, D로 class가 4개 이므로 4로 나누어서 average Recall을 구합니다. MODEL 1 Predictions o..
-
집합 자료형 관련 함수
집합 자료형 관련 함수 다음 메소드들은 set을 변경하는 집합 자료 구조 메소드들입니다.