주요 연관성 분석 알고리즘

CODEDRAGON Development/Big Data, R, ...

반응형



 

 

연관성 규칙 생성을 위한 주요 알고리즘

연관성 분석의 대표적인 알고리즘에는 아프리오리(Apriori) 알고리즘과 이를 개선한 빈출패턴 성장(FP-Growth) 알고리즘이 있습니다.

 

 

 

주요 연관성 분석 알고리즘

알고리즘

알고리즘 설명

아프리오리(Apriori) 알고리즘

·       빈출 아이템 집합을 효과적으로 계산하기 위하여 검토해야 할 대상 집합 Pool을 효과적으로 줄여주는 기법입니다.

·       , 특정 집합 {1,2}가 빈발하지 않는다면, 이들을 포함한 {0,1,2}, {1,2,3}, {1,2,4}, {0,1,2,3,4} 등도 빈발하지 않은 것이 되어, 지지도 계산 검토 대상에서 제외할 수 있습니다. 이런 식으로 검토대상의 아이템 데이터 집합을 효과적으로 줄여서 연관규칙을 계산해내는 기법입니다.

·       데이터가 커질 경우 계산량이나 속도 면에서 비효율적이라는 단점이 있습니다.

빈출패턴 성장 (FP-Growth)

·       아프리오리 알고리즘의 빈발 아이템을 찾는 방법을 개선한 알고리즘으로서 데이터베이스를 모든 중요한 정보를 가진 FP-Tre라는 구조로 압축한 뒤, 높은 빈도의 세트에 관련한 조건부 데이터 세트로 분할하여 규칙을 만들어 냅니다.

·       전체 데이터베이스를 검색하는 작업이 아프리오리 알고리즘보다 현저하게 줄어들어서 높은 성능과 처리속도를 보이는 알고리즘입니다. 반면, 아프리오리 알고리즘보다 구현이 어렵다는 단점이 있습니다.

 

 

 

 

아프리오리(Apriori) 알고리즘

https://codedragon.tistory.com/9464

 

아프리오리(Apriori) 알고리즘 수행 절차

https://codedragon.tistory.com/9525

 

 

 

 

빈출패턴 성장(FP-Growth) 알고리즘

https://codedragon.tistory.com/9110