关联规则挖掘和频繁项集挖掘之间有什么区别

Zia*_*Zia 10 data-mining

我是数据挖掘的新手,并且对关联规则和频繁的项目挖掘感到困惑.对我来说,我认为两者都是一样的,但我需要本论坛专家的意见

我的问题是

关联规则挖掘和频繁项集挖掘有什么区别?谢谢

Jou*_*nen 19

关联规则类似于"A,B→C",意味着当A和B出现时C倾向于发生.项目集只是一个集合,例如"A,B,C",如果它的项目倾向于共同出现,则频繁出现.查找关联规则的常用方法是查找所有频繁项集,然后将它们后处理为规则.


Phi*_*hil 8

频繁项集挖掘的输入是:

  • 一个交易数据库
  • 最低支持阈值 minsup

输出是:

  • 至少在minsup交易中出现的所有项目集的集合.itemset只是一组无序的项目.

关联规则挖掘的输入是:

  • 一个交易数据库
  • 最低支持阈值 minsup
  • 最低置信度阈值 minconf

输出是:

  • 所有有效关联规则的集合.关联规则X - > Y是两个项集X和Y之间的关系,使得X和Y是不相交的并且不是空的.有效规则是支持更高或等于minsup且置信度高于或等于minconf的规则.支持定义为sup(x - > Y)= sup(XUY)/(交易数量).置信度定义为conf(x - > Y)= sup(XUY)/ sup(X).

现在,项目集和关联规则挖掘之间的关系,这是很有效的利用频繁项集生成规则(见1993年阿格拉瓦尔纸)关于这个想法的更多细节.因此,关联规则挖掘将分为两个步骤: - 挖掘频繁项集 - 使用频繁项集生成所有有效的关联规则.


Ahm*_*dov 5

频繁项集挖掘是关联规则挖掘的第一步.生成所有频繁项目集后,继续逐个迭代它们,枚举所有可能的关联规则,计算它们的置信度,最后,如果置信度> minConfidence,则输出该规则.