Development/Big Data, R, ...(885)
-
빅데이터 기술 분류
빅데이터 기술 분류 빅데이터로부터 지식을 발굴해 활용하기까지는 데이터 생성 및 수집, 저장, 처리, 분석, 시각화와 같은 여러 과정을 거칩니다. 각 단계별로 지원하는 다양한 기술이 있습니다. 과정 설명 해당기술 생성 조직의 내부와 외부에 존재하는 여러 데이터를 생성하는 기술 • 데이터베이스(Database) • 파일관리시스템(File Management system) • 인터넷으로 연결된 파일 등 수집 조직의 내부와 외부에서 생성되는 여러 데이터 소스로부터 필요로 하는 데이터를 검색하여 수동 또는 자동으로 수집하는 과정과 관련된 기술로 단순 데이터 확보가 아닌 검색, 수집, 변환을 통해 정제된 데이터를 확보하는 기술 • 로그 수집기 • 크롤링 • 센싱 • RSS Reader, Open API • ETL(..
-
한국정보화진흥원, 빅데이터 기술 분류 및 현황
한국정보화진흥원, 빅데이터 기술 분류 및 현황 http://bit.ly/2AXod3Q http://bit.ly/2qEDrVi 목차 1. 빅데이터 기술 동향 2. 빅데이터 요소기술 분류 3. 빅데이터 기술별 유형 및 특성 4. 국내외 빅데이터 표준화 동향 직접 다운로드
-
가설(Hypothesis), Andreas Cellarius의 가설
가설(Hypothesis)· 어떠한 문제를 검증하기 위해 밀 세우는 결론· 현실적 조건에서는 경험적으로 검증 가능한(empirically testable) 사물, 현상의 원인 또는 합법칙성에 관하여 예측하는 것을 말합니다. http://bit.ly/2EQcXdshttp://bit.ly/2OVzl9Vhttps://en.wikipedia.org/wiki/Hypothesis Andreas Cellarius의 가설행성의 움직임을 보여주는 Andreas Cellarius의 가설
-
검정 vs 검증
검정 vs 검증 통계와 분석에서는 검증이 아닌 검정이라는 용어를 사용해야 합니다.
-
BOW(Bag of Words), BOW 원리, BOW 특징
BOW(Bag of Words) · 문서 데이터를 고정된 크기의 숫자 벡터로 바꾸는 방법 중 가장 널리 쓰이는 방법입니다. · 문서를 이루는 단어의 순서, 의미 등의 정보를 모두 무시하고 오로지 특정한 단어가 문서에 몇 번 나왔는지만 세어 그 빈도를 벡터로 표시합니다. https://en.wikipedia.org/wiki/Bag-of-words_model BOW 방법에서는 전체 문서 {d1,d2,…,dn} 를 구성하는 고정된 단어장(vocabulary) {t1,t2,…,tm} 를 만들고 di 라는 개별 문서에 단어장에 해당하는 단어들이 포함되어 있는지를 표시하는 방법입니다. xi,j=문서 di내의 단어 tj의 출현 빈도 또는 BOW 원리 · 대부분의 문서가 10,000개의 단어로 구성된다고 가정하겠습니다..
-
인공지능신문(Artificial Intelligence Times)
인공지능신문(Artificial Intelligence Times) http://www.aitimes.kr/