数据挖掘中的模式发现(五)挖掘多样频繁模式
s(x)是给出了X的所有项统计独立的概率估计。如果它的支持度小于使用统计独立性假设计算出的期望支持度。s(X)越小,模式就越负相关。简单来说,就是这两个事件不太会同时发生。 基于Kulczynski测量的定义如果两个项集A和B,有如下关系 则称其为负相关。(其中
负相关关联规则规则
其中
其中
是负相关的,但是其中项集内的项之间是负相关的,眼镜盒镜头清洁剂是负相关的,如果使用完全条件,可能就不能发现该规则了。 负相关条件也可以用正项集和负项集的支持度表示 可以得到负相关的条件为 负相关项集和负相关关联规则统称为负相关模式(negatively correlated pattern)。 挖掘压缩模式(Mining Compressed Patterns)我们在进行数据挖掘的时候,会发现大量的模式,但是其中有不少的模式会有一些相似的地方,所以你得出这些规则并没有太多的意义。 (编辑:淮安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |