对Apriori的最小信心和最低支持

lms*_*asu 3 algorithm parameters data-mining apriori

Apriori算法的最小置信度和最小支持值的适当值是什么?你怎么能调整它们?它们是固定值,还是在运行算法期间会发生变化?如果您之前使用过此算法,您使用了什么值?

Geo*_*tas 8

我建议从支持值0.05和置信度0.80开始.但我同意您应该了解它们究竟代表什么,以便能够恰当地定义它们.对于规则A => B(其中A,B非空集)

Support (A ? B): s = P(A, B)
Confidence (A ? B): c = P(B | A)
Lift (A ? B): L = c/P(B)
Run Code Online (Sandbox Code Playgroud)

提升对于评估规则的有趣性非常重要(因为您通常会提出数百个规则).已经提出了20多种有趣的措施.这些包括Ф-系数,kappa,互信息,J-度量和基尼指数.我个人根据J-measure命令我的规则.

J.measure (A ?B): J = s/c * (c*log(L) + (1-c)*log((L-c)/L))
Run Code Online (Sandbox Code Playgroud)