전체 글(14830)
-
LAB-불린 인덱스를 통한 데이터 정제
LAB 불린 인덱스를 통한 데이터 정제 시나리오 · 데이터 분석을 하는 중에 의뢰인이 데이터셋 dirty에 들어 있는 데이터는 절대 음수가 될 수 없다고 전해 왔다고 가정하겠습니다. · 즉, 음수 값은 진짜 값이 아닌 오류이며, · 여러분이(분석가가) 직접 이를 더 말이 되는 값(0 등)으로 바꿔야 합니다. · 즉, 데이터 클리닝(data cleaning), 데이터 정제, 데이터 전처리 작업을 해야 합니다. 제공된 데이터 [9, 4, 1, -0.01, -0.02, -0.001] 데이터 전처리 · 더러운 데이터(음수)를 깨끗이 하려면 이상한 값을 찾아내어 합리적인 대안(0)으로 교체해야 합니다. · {Numpy} 불린 인덱싱을 활용 하여 처리 예상 출력 결과 [9. 4. 1. 0. 0. 0.]
-
초기화 블록 종류
초기화 블록 종류 · 인스턴스 초기화 블록 · 클래스 초기화 블록 인스턴스 초기화 블록 · 인스턴스 초기화 블록은 단순히 중괄호({})만을 사용하여 정의할 수 있습니다. · 인스턴스 초기화 블록은 생성자와 마찬가지로 인스턴스가 생성될 때마다 실행됩니다. · 하지만 인스턴스 초기화 블록이 생성자보다 먼저 실행됩니다. · 생성자와 인스턴스 초기화 블록의 차이는 거의 없으므로 인스턴스 초기화 블록은 잘 사용되지 않습니다. · 여러 개의 생성자가 있으면 모든 생성자에서 공통으로 수행되어야 할 코드를 인스턴스 초기화 블록에 포함하여 코드의 중복을 막을 수 있습니다.
-
Dart(다트)
Dart · ≒ 다트 · 구글에서 만든 확장 가능한 웹 프로그래밍 언어 · 모바일 앱, 웹 앱(Web App), 명령어 스크립트(command-line script) 까지 개발할 수 있습니다. · 기존 프로그래밍 언어인 JAVA와 유사합니다. http://bit.ly/2PJ99y6 https://en.wikipedia.org/wiki/Dart_(programming_language) https://dart.dev/
-
Anaconda Python - install(설치하기)
Anaconda Python - install(설치하기) 다운받은 설치파일을 실행합니다. [Next] [I Agree] [Next] "Destination Folder"항목 우측의 [Browse…]버튼 클릭 설치 경로를 아래와 같이 수정한 후 >> [Next]
-
품사를 결정하는 방법
품사를 결정하는 방법 일반적으로 의미적 모호성을 갖는 단어들에 대하여 품사를 결정하는 방법은 통계적 방법과 규칙 기반형 방법이 있습니다. · 통계적 방법 · 규칙 기반형 방법 통계적 방법 · 품사의 모호성을 제거하기 위해 대량의 사전을 참고하여 어휘적 확률과 문맥적 확률을 계산하여 품사를 결정합니다. · 어휘적 확률과 문맥적 확률의 곱을 최대로 하는 쪽으로 의미적 모호성을 갖는 단어들에 대하여 최적의 품사를 지정합니다.
-
데이터 프레임 연산
데이터 프레임 연산· numpy의 기능으로 pandas에서도 동일하게 적용됩니다.· 2차원 데이터는 행을 기준으로 계산할 수도 있고, 열(column)을 기준으로 계산할 수도 있습니다. · 행과 열에 대한 연산을 동시에 할 때, 행 우선 계산과 열 우선 계산을 구분하여 연산을 수행할 수 있습니다. parameter descripton axis = 0 기본 값입니다 행 방향을 나타냅니다. axis = 1 열 방향을 축으로 삼아 계산합니다. 열 방향을 축으로 계산