CODEDRAGON ㆍDevelopment/Big Data, R, ...
연관성 규칙 생성을 위한 주요 알고리즘
연관성 분석의 대표적인 알고리즘에는 아프리오리(Apriori) 알고리즘과 이를 개선한 빈출패턴 성장(FP-Growth) 알고리즘이 있습니다.
주요 연관성 분석 알고리즘
알고리즘 |
알고리즘 설명 |
아프리오리(Apriori) 알고리즘 |
· 빈출 아이템 집합을 효과적으로 계산하기 위하여 검토해야 할 대상 집합 Pool을 효과적으로 줄여주는 기법입니다. · 즉, 특정 집합 {1,2}가 빈발하지 않는다면, 이들을 포함한 {0,1,2}, {1,2,3}, {1,2,4}, {0,1,2,3,4} 등도 빈발하지 않은 것이 되어, 지지도 계산 검토 대상에서 제외할 수 있습니다. 이런 식으로 검토대상의 아이템 데이터 집합을 효과적으로 줄여서 연관규칙을 계산해내는 기법입니다. · 데이터가 커질 경우 계산량이나 속도 면에서 비효율적이라는 단점이 있습니다. |
빈출패턴 성장 (FP-Growth) |
· 아프리오리 알고리즘의 빈발 아이템을 찾는 방법을 개선한 알고리즘으로서 데이터베이스를 모든 중요한 정보를 가진 FP-Tre라는 구조로 압축한 뒤, 높은 빈도의 세트에 관련한 조건부 데이터 세트로 분할하여 규칙을 만들어 냅니다. · 전체 데이터베이스를 검색하는 작업이 아프리오리 알고리즘보다 현저하게 줄어들어서 높은 성능과 처리속도를 보이는 알고리즘입니다. 반면, 아프리오리 알고리즘보다 구현이 어렵다는 단점이 있습니다. |
아프리오리(Apriori) 알고리즘
https://codedragon.tistory.com/9464
아프리오리(Apriori) 알고리즘 수행 절차
https://codedragon.tistory.com/9525
빈출패턴 성장(FP-Growth) 알고리즘
https://codedragon.tistory.com/9110
'Development > Big Data, R, ...' 카테고리의 다른 글
아프리오리(Apriori) 알고리즘 (0) | 2019.10.28 |
---|---|
saddle point(새들 포인트) (0) | 2019.10.28 |
장바구니분석 (market basket analysis) (0) | 2019.10.27 |
marketbasket.csv (0) | 2019.10.26 |
빈출패턴 성장(FP-Growth) 알고리즘 (0) | 2019.10.26 |