R语言可视化操作数据挖掘

时间:2022-07-23
本文章向大家介绍R语言可视化操作数据挖掘,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

今天给大家介绍一个在R语言中实现了可视化的操作界面的包rattle。此包主要用来实现数据的挖掘的相关功能。首先我们看下包的安装:

install.packages(“RGtk2”)
install.packages(“rattle”)

接下来我们进行详细界面的解说,通过rattle()函数我们可以启动此包的可视化操作界面,如下:

首先是数据的载入,此包提供了八种数据的载入形式,其实我们正常用到的不过是file(从文件读入),Rdata(R语言生成的数据)。我们直接使用此包自带的数据集,所以直接点击“Execute”会出现下面的页面:

点击“Yes”后就看到载入的数据了:

这样,我们的数据集已载入工作环境,我们可以首先进行一个简单的数据描述性统计,我们需要选择“Explore”目录,然后就可以看到描述性统计以及相关的PCA分析,相关性分析等。当然如果相关的功能包未安装时,他会提醒安装:

我们直接看下实例,首先是描述性总结:

然后是主成分分析,会产生各成分的数据以及极坐标图

当然我们也可以借助ggraptR包对数据进行交互式操作:

接下来就是各种统计检验分析,基本都包括了,你只需要选择对应的列就行:

我们直接看下实例:

然后是数据的标准化处理界面:

最后是模型模块,包括了聚类分类模型的构建:

聚类模型:

关联规则分析:

分类模型:

分类模型构建的优化,及结果的展示:

当然,如果你觉得想把程序保留下来,那么也是可以的,通过下面的log栏目直接复制粘贴就好:

另外,此包还有个强大的功能就是顶部的导航栏:

这样整个数据挖掘的分析过程都包含在这个包里了,是不是很方便,就是不知道在数据量很大的时候会不会卡死。

欢迎大家学习交流!