关联规则
大部分关联规则挖掘最终得出的是支持度与置信度。但是“强”关联规则不一定是正确的,这是因为这件事务的支持度可能大于与某项事物的置信度。
从关联分析到相关分析
我们对关联规则进行扩充得到,支持度,置信度,相关性称之为相关规则
相关性的表示:
- 提升度:
lift(A,B)=conf(A=>B)/sup(B) - 卡方
X2=观测值?期望值期望值 全置信度
all_conf(A,B)=min{ P(A|B),P(B|A)}最大置信度
max_conf(A,B)=max{ P(A|B),P(B|A)}- Kulc度量
Kulc(A,B)=max{ P(A|B),P(B|A)} - 余弦度量
cosine(A,B)=P(A|B),P(B|A)?????????????√