在计算机科学以及数据挖掘领域中,关联规则算法(Apriori Algorithm)是经典的算法之一。关联规则算法的设计目的是为了处理包含交易信息内容的数据库,而其他的算法则是设计用来寻找无交易信息或无时间标记的数据之间的联系规则。 在关联式规则中,一般对于给定的项目集合,算法通常尝试在项目集合中找出至少有C个相同的子集。
作为专业的留学生服务机构,AcademicPhD多年来已为美国、英国、加拿大、澳洲等留学热门地的学生提供专业的学术服务,包括但不限于Essay代写,Assignment代写,Dissertation代写,Report代写,小组作业代写,Proposal代写,Paper代写,Presentation代写,计算机作业代写,论文修改和润色,网课考试管理等等。写作范围涵盖高中,本科,研究生等海外留学全阶段,辐射金融,经济学,会计学,审计学,管理学等全球99%专业科目。写作团队既有专业英语母语作者,也有海外名校硕博留学生,每位写作老师都拥有过硬的语言能力,专业的学科背景和学术写作经验。我们承诺100%原创,100%专业,100%准时,100%满意。
关联规则算法(Apriori Algorithm)代写
Agrawal和R. Srikant在1994年提出了在数据集中寻找布尔关联规则频繁项集的Apriori算法。该算法的名称为Apriori,因为它使用了频繁项目集属性的先验知识。我们采用迭代方法或水平搜索,使用k频繁项集来查找k+1个项集。为了提高分层生成频繁项集的效率,引入了一个重要的属性——Apriori属性,该属性有助于减少搜索空间。
Apriori算法的优缺点
优点:
- Aprioi算法采用逐层搜索的迭代方法,算法简单明了,没有复杂的理论推导,也易于实现。
- 数据采用水平组织方式。
- 采用Apriori 优化方法。
- 适合事务数据库的关联规则挖掘。
- 适合稀疏数据集:根据以往的研究,该算法只能适合稀疏数据集的关联规则挖掘,也就是频繁项目集的长度稍小的数据集。
缺陷:
- 对数据库的扫描次数过多。
- Apion算法可能产生大量的候选项集。
- 在频繁项目集长度变大的情况下,运算时间显著增加。
- 采用唯一支持度,没有考虑各个属性重要程度的不同。
- 算法的适应面窄。
- Apriori算法不是一个有效的方法来处理大量的数据集。
比较一下FP-growth算法的优缺点
优点:FP-growth是一个高度压缩的结构,它存储了用于挖掘频繁项集的全部信息。
缺点:树的子节点过多,例如生成了只包含前缀的树,那么也会导致算法效率大幅度下降。FP-Growth算法需要递归生成条件数据库和条件FP-tree,所以内存开销大,而且只能用于挖掘单维的布尔关联规则。
关联规则算法还可以用于其他特殊领域:数据挖掘(Data mining),机器学习(Machine learning)等都需要这部分的专业知识。如有代写需要,欢迎咨询AcademicPhD!