Development/Big Data, R, ...(885)
-
Tidy Animated Verbs
Tidy Animated Verbs 데이터를 결합하는 join 방법을 R 애니메이션으로 쉽게 이해할 수 만들어놓은 사이트입니다. 세부적인 사항은 해당 사이트에서 확인하시기 바랍니다. http://bit.ly/2WvvLm2 Mutating Joins Inner Join Left Join Left Join (Extra Rows in y) Right Join Full Join Filtering Joins Semi Join Anti Join Set Operations Union Union All Intersection Set Difference Tidy Data Spread and Gather Mutating Joins Filtering Joins Set Operations ' Tidy Data
-
최빈값(mode), 최빈수
최빈값(mode)· ≒ 최빈수· 데이터에서 가장 자주 나타난 값· 자료 분포 중에서 가장 빈번히 관찰된 최다도수를 갖는 자료값· 자료에서 가장 많이 나타나는 수· 이상치에 의한 영향을 덜 받으며, 데이터 분포가 비대칭인 경우 평균보다 의미가 있습니다.· 최빈값은 table()함수을 사용해 각 데이터가 출현한 횟수를 센 분할표(Contingency Table)를 만들고, which.max()함수를 사용해 최대 빈도가 저장된 색인을 찾는 방법으로 구할 수 있습니다.
-
Apriori 알고리즘 연관 분석절차
Apriori 알고리즘 연관 분석절차
-
Brightics Studio - 삼성 SDS에서 만든 오픈소스 AI 분석 플랫폼
Brightics Studio삼성 SDS에서 만든 오픈소스 AI 분석 플랫폼 주요 특징 https://codedragon.tistory.com/8512 http://brightics.ai/ https://github.com/brightics/studio
-
K-평균 알고리즘(K-means algorithm)
K-평균 알고리즘(K-means algorithm)· K-평균 알고리즘은 분할기법의 대표 알고리즘입니다.· 주어진 데이터를 K개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작합니다. · K-평균 알고리즘은 주어진 데이터에서 K개의 데이터 오브젝트를 임의로 추출합니다. 그리고 그 데이터 오브젝트들을 각 클러스터의 중심으로 설정합니다. 그 후 각 클러스터의 중심과 그룹 내의 데이터의 거리 제곱합을 비용 함수로 정하고, 이 함수값을 최소화하는 방향으로 각 데이터의 소속 그룹을 업데이트 합니다. K-평균 알고리즘은 이 과정으로 클러스터링을 수행하게 됩니다. https://ko.wikipedia.org/wiki/K-%ED%8F%89%EA%B7%A0_%EC%95%8C%E..
-
오피니언 마이닝(Opinion Mining)
오피니언 마이닝(Opinion Mining)· ≒ 평판 분석(Sentiment Analysis) ≒ 감성분석 ≒ emotion AI· 비정형 데이터 마이닝의 유형 중 하나입니다.· 텍스트 마이닝(Text Mining)에서 발전된 분석 기법입니다.· 오피니언(Opinion)은 상품평이나 영화 감상평 또는 정치인에 대한 호감도와 같이 특정 주제나 대상에서 보인 사람들의 주관적이고 감정적인 의견을 의미합니다.· 오피니언 마이닝(Opinion Mining)은 오피니언이 포함된 빅데이터에서 사용자가 게재한 의견과 감정을 나타내는 패턴을 이용하여 특정 주제에 보인 사람들의 주관적이고 감정적인 의견을 분석하여 긍정(Positive)인지, 부정(Negative)인지, 중립(Neutral)인지를 찾아냅니다. 이를 통해 ..