Development/Big Data, R, ...(885)
-
saddle point(새들 포인트)
saddle point(새들 포인트) · 변수가 두 개인 함수에서 한 변수에 대해서는 극소점이면서 다른 변수에 대해서는 극대점이 되는 변수의 값을 나타내는 곡면 위의 점입니다. · 그래프로 그리면 모양이 말 안장처럼 생겨서 새들 포인트라고 합니다. https://en.wikipedia.org/wiki/Saddle_point
-
주요 연관성 분석 알고리즘
연관성 규칙 생성을 위한 주요 알고리즘 연관성 분석의 대표적인 알고리즘에는 아프리오리(Apriori) 알고리즘과 이를 개선한 빈출패턴 성장(FP-Growth) 알고리즘이 있습니다. 주요 연관성 분석 알고리즘
-
장바구니분석 (market basket analysis)
장바구니분석 (market basket analysis) · ≒ 장바구니 마이닝 · 장바구니분석은 장바구니 데이터에서는 주로 트랜잭션 사이의 연관성을 살펴보는 것으로, 빈번히 나타나는 규칙을 찾아내는 것입니다. https://ko.wikipedia.org/wiki/데이터_마이닝 https://en.wikipedia.org/wiki/Association_rule_learning
-
marketbasket.csv
marketbasket.csv · Tariq Mahmood(타리크 마흐무드) 박사의 웹사이트에서 제공하는 장바구니 분석용 테스트 파일입니다. · 각 열은 제품의 종류, 각 행은 거래를 나타내며 데이터는 제품 302개에 대한 거래 1,361개로 구성되어 있으며, 총 거래량은 411,000개 이상입니다. · 데이터에는 수량이 없다는 점에 주의해야 합니다. 단지 아이템을 구매했는지(true) 구매하지 않았는지(false) 여부만 담겨 있습니다.
-
빈출패턴 성장(FP-Growth) 알고리즘
빈출패턴 성장(FP-Growth) 알고리즘 · ≒ Frequent Pattern Growth Algorithm · 아프리오리 알고리즘은 나름대로 효율적으로 아이템 집합의 수를 제한함으로써 연관규칙 생성을 효율화하였지만, 결국 데이터 집합에 있는 각각의 아이템을 살피면서 빈발항목 집합의 조건에 포함되는지 아닌지를 판정해야 하므로, 빅데이터 상황에서는 이러한 처리 프로세스 자체가 엄청난 부담이 될 수 있습니다. 따라서 빅데이터 상황에서는 더욱 효율적으로 빈발항목 집합을 찾아내는 알고리즘이 필요하게 됩니다. 빈출패턴 성장(FP-Growth) 알고리즘은 바로 이런 목적을 위해 아프리오리 알고리즘을 개선한 알고리즘입니다. · 기본적으로 최소 지지도 임계치 이상의 항목 집합을 찾은 뒤 최소 신뢰도를 넘는 연관규칙을..
-
아프리오리(Apriori) 알고리즘 동작원리
아프리오리(Apriori) 알고리즘 동작원리아프리오리 알고리즘의 대략적인 절차는 아래와 같습니다.상향식(bottom-up) 접근 방법을 사용하는 Apriori 알고리즘은 한 번에 하나씩 아이템 집합을 순회하며 동작합니다. 후보 그룹은 데이터를 검증받습니다. 더 이상 집합 확장이 없으면 알고리즘은 멈춥니다. {1,2,3,4} {1,3,4} {1,2} {2,3,4} {3,4} {2,4} 가 개별 아이템 (1-항목집합) 중에서 최소 지지도 임계치를 넘는 모든 빈발품목 집합(frequent item set) 즉, 1-항목 빈발항목집합을 찾는다. 각 아이템의 지지도를 계산한다. {1,2} = 2 {1,3} = 2 {1,4} = 2 {2,3} = 2 {2,4} = 3 {3,4} = 4 다 '나' 단계에서 만들어진 ..