高级编程--数据类型(泛型向量或列表)

时间:2021-08-17
本文章向大家介绍高级编程--数据类型(泛型向量或列表),主要包括高级编程--数据类型(泛型向量或列表)使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

数据类型--泛型向量或列表

列表是原子向量和/或其他列表的集合。数据框是一种特殊的列表,集合中每个原子向量都有相同的长度。在安装R时自带iris数据框,这个数据框描述了150种植物的四种物理测度及其种类(setosaversicolorvirginica):

head(iris)

这个数据框实际上是包含五个原子向量的列表。它有一个names属性(变量名的字符串向量),一个row.names属性(识别单个植物的数字向量)和一个带有"data.frame"值的class属性。每个向量代表数据框中的一列(变量)。这可以很容易地使用unclass()打印数据框看到,并且可以用attributes()函数得到数据集的属性:

你可以使用K均值聚类分析来对iris数据进行聚类分析。假定数据中存在三类,观测这些观测值(行)是如何被分组的。你可以忽略种类变量(species variable),仅仅使用每个植物的物理测度来聚类。所需的代码是:

set.seed(1234)

fit <- kmeans(iris[1:4], 3)

对象fit中包含的信息是什么?kmeans()函数的帮助页面表明该函数返回一个包含七种成分的列表。str()函数展示了对象的结构,unclass()函数用来直接检查对象的内容。length()函数展示对象包含多少成分,names()函数提供了这些成分的名字。你可以使用attributes()函数来检查对象的属性。下面探讨通过kmeans()得到的对象内容:

names(fit)

unclass(fit)

执行sapply(fit, class)返回该类每个成分的对象:

sapply(fit, class)

cluster是包含集群成员的整数向量,centers是包含聚类中心的矩阵(各个类中每个变量的均值)。size是包含三类中每一类植物的整数向量。

本文来自博客园,作者:zhang-X,转载请注明原文链接:https://www.cnblogs.com/YY-zhang/p/15154189.html

原文地址:https://www.cnblogs.com/YY-zhang/p/15154189.html