Development/Big Data, R, ...(885)
-
머신러닝 vs 통계학
머신러닝 vs 통계학
-
데이터 분석용 파이썬 패키지
데이터 분석용 파이썬 패키지 · 다양한 파이썬 패키지를 사용하여 데이터 분석을 할 수 있습니다. · 패키지에는 Ipython, Numpy, Scipy, Pandas, Matplotlib, Beautiful Soup 등 데이터 분석과 시각화를 위한 다양한 라이브러리를 제공하며 적은 코드만으로 많은 기능을 만들 수 있습니다.
-
강화학습 도식도
강화학습 도식도· 칭찬을 받은 행위(보상)는 더욱 많이 하고, 벌을 받을만한 행위는 줄이는 것과 마찬가지로 적응성을 통해 학습을 강화해갑니다. 학습의 결과가 즉각적으로 나타나는 경우에 효과적이라고 할 수 있습니다.· Agent(행위자)의 Action(행위)은 World(Environment; 환경)에 영향을 줍니다. 특정 액션은 환경의 상태(State)를 변화시키고이에 따라 에이전트는 보상(Reward)을 받게 됩니다.
-
값이 누락된 데이터 처리
값이 누락된 데이터 처리 누락 데이터 삭제 또는 추정해서 채우기를 합니다. 이름 나이 키 몸무게 거주지 홍길동 39 160cm 50kg 서울 도레미 27 175cm NA 부산 이순신 25 NA 62kg 수원 이순신의 키: (175+160)/2 = 167.5 도레미의 몸무게: (50+62)/2 = 56
-
데이터 교정
데이터 교정 비정형 데이터를 수집하는 경우 반드시 수행해야 합니다. · 결측치 변환, · 이상치 제거, · 노이즈 데이터 교정, · 누락된 값 채우기, · 데이터 문자 정리
-
다중 공선성(multicollinarity)
다중 공선성(multicollinarity) · 다중 공선성은 회귀 모델에서 변수 간의 상관관계가 커서 한 변수를 다른 변수들의 선형 조합으로 손쉽게 예측할 수 있는 경우를 뜻합니다. · 다중공선성은 회귀계수의 분산을 증가시킵니다. · 다중 공선성이 존재하면 회귀모델 계수 β0, β1, β2, …, βp의 추정이 어려워집니다. 다중 공선성 예 Xi1 = aXi2 + bXi3이 성립한다면 선형 회귀 식에서 Xi1 변수의 사용이 무의미해지기 때문입니다. http://bit.ly/38giIf4 https://en.wikipedia.org/wiki/Multicollinearity