关联分析--关联规则的可视化

时间:2021-09-08
本文章向大家介绍关联分析--关联规则的可视化,主要包括关联分析--关联规则的可视化使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

关联规则的可视化

我们尝试用图形的方式更直观地显示出关联分析结果,这里需要用到R的扩展软件包arulesViz

rules5<-apriori(Groceries,parameter = list(supp=0.002,conf=0.5))

rules5    #显示生成的关联规则条数

plot(rules5)

结果分析:图中每个点对应于相应的支持度和置信度值,分别由图形的横纵轴显示,且其中关联规则点的颜色深浅由lift值的高低决定。

另外也可以通过更改参数设置,来变换横纵轴及颜色条所对应的变量,如:

plot(rules5,measure = c("support","lift"),shading="confidence")

结果分析:从图中我们可以看出大量规则的参数取值分布情况,如提升度较高的关联规则的支持度往往较低,支持度与置信度具有明显反相关性等。但不足之处在于,并不能具体得知这些规则对应的是哪些商品,及它们的关联强度如何等信息。而这一缺陷可通过互动参数(interactive)的设置来弥补。

plot(rules,interactive = T)

结果分析:在图形下端有5个按钮。我们可以在图上通两次单击圈定感兴趣的若干个点,如上图所示。有十字形标示的阴影区域中有两个关联规则被选定,然后单击“inspect”按钮就可以获取选定点的详细信息。

结果分析:当单击filter”过滤按钮后,再单击图形右侧 lift 颜色条中的某处,即可将小于单击处 lif值的关联规则点都过滤掉,如图所示即为过滤掉lift值小于3的点后的互动散点图。

将参数shading设置为order来绘制Two-key图,横纵轴为支持度和可信度,更换连规则点的颜色深浅则表示其所代表的关联谷子额含有商品多少,商品种类越多,点的颜色越深。

plot(rules5,shading ="order",control=list(main="Two-key plot") )

将图形类型更改为grouped”。从图中按照 lift参数来看,关联性最强(圆点颜色最深)的两种商品为黄油(butter)与生/酸奶油(whipped/sour cream);而以 support参数来看则是热带水果(tropical fruit)与全脂牛奶(whole milk)关联性最强(圆点尺寸最大)

plot ( rules5 , method = "grouped" )    ##rules5作分组图

本文来自博客园,作者:zhang-X,转载请注明原文链接:https://www.cnblogs.com/YY-zhang/p/15244222.html

原文地址:https://www.cnblogs.com/YY-zhang/p/15244222.html