Development/Big Data, R, ...(885)
-
conda 가상환경
conda 가상환경 · 생성된 가상환경은 파이썬버전, 환경설정, 패키지 간의 독립성을 보장해줍니다. · 가상환경 내에서의 변경 사항은 다른 가상환경에 영향을 끼치지 않습니다. · 여러 개의 파이썬 프로젝트를 진행하여 관리할 수 있습니다.
-
텍스트 마이닝(Text Mining)
텍스트 마이닝(Text Mining) · ≒ 텍스트 분석 · 비정형 데이터 마이닝의 유형 중 하나입니다. · 정형화되지 않은 문자 데이터에서 유의미한 정보를 찾아내어, 쓸모 있는 정보로 가공, 분석하는 것입니다. · 텍스트 기반의 데이터에서 새로운 정보를 발견할 수 있도록 검색, 추출, 체계화, 분석하는 기술 및 처리 과정입니다. · 반전형 또는 비정형 텍스트에서 자연어 처리기술을 기반으로 가치있는 정보를 추출하고 가공합니다. · 텍스트 마이닝(Text Mining)을 활용하면 비정형화된 문서에서 정보를 얻을 수 있다는 장점이 있습니다. · 텍스트 마이닝(Text Mining)은 텍스트 프로세싱(Text-processing) 기술 및 처리 과정을 포함합니다. 이는 텍스트 기반의 데이터로부터 새로운 정보를..
-
활성화 함수(Activation Function), 주요 활성 함수-계단(Step)함수, 부호(sign), threshold함수, 시그모이드(Sigmoid) 함수, 소프트맥스(Softmax)함수, 표준화지수(일반화로지스틱)함수, tanh 함수, 가우스(Gauss)..
활성화 함수(Activation Function)· 전이 함수라고도 합니다.· 결과값을 내보낼 때 사용하는 함수입니다. 주요 활성 함수· 시그모이드 함수, 쌍곡 탄젠트 함수를 가장 많이 사용합니다.· 이 함수는 가중치 값을 학습할 때 에러가 적게 나도록 도와줍니다.
-
1.Summary - 1.기본통계 확인하기
summary() 함수의 요약정보 해석전반적인 기초 통계량을 보여주는 summary() 함수의 요약정보 해석하기 iris데이터에 대한 summary()함수의 실행결과입니다. 컬럼 설명 min · 최솟값 1st Qu · Lower Quartile · 1사 분위수 (25% 분위수) · 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 위에 있는 값 · 즉, 하위 25%의 값을 의미 Median · 중앙값(median) ≒ 중위수 ≒ 2사분위수 · 데이터를 크기대로 정렬하였을 때 가장 가운데에 있는 수 · 컬럼 데이터를 오름차순으로 정렬하여 가운데에 있는 값 · 데이터의 수가 짝수이면 가장 가운데에 있는 두 수의 평균을 사용합니다. Mean · 평균값 3st Qu · Upper Quartile · 3사 ..
-
esquisse - ggplot2 Interactive builder
esquisse - ggplot2 Interactive builder Rstudio에 add-in로 설치하여 사용할 수 있습니다. https://github.com/dreamRs/esquisse
-
수행 내용-수집 시스템 구축하기
수행 내용-수집 시스템 구축하기 수행 순서 Step1.수집 데이터 유형을 파악한다. Step2.수집 데이터의 유형 및 종류에 따라 수집 기술을 결정한다. Step3.수집 솔루션의 아키텍처를 파악하고 적합한 아키텍처를 수립한다. Step4.하드웨어 스펙 및 규모를 결정하고 하드웨어를 구축한다. Step5.수집 솔루션을 설치하고 실행 환경을 구성한다. 수집 시스템 구축 절차