高级编程--数据类型（泛型向量或列表）

数据类型--泛型向量或列表

列表是原子向量和/或其他列表的集合。数据框是一种特殊的列表，集合中每个原子向量都有相同的长度。在安装R时自带iris数据框，这个数据框描述了150种植物的四种物理测度及其种类（setosa、versicolor或virginica）：

head(iris)

这个数据框实际上是包含五个原子向量的列表。它有一个names属性（变量名的字符串向量），一个row.names属性（识别单个植物的数字向量）和一个带有"data.frame"值的class属性。每个向量代表数据框中的一列（变量）。这可以很容易地使用unclass()打印数据框看到，并且可以用attributes()函数得到数据集的属性：

你可以使用K均值聚类分析来对iris数据进行聚类分析。假定数据中存在三类，观测这些观测值（行）是如何被分组的。你可以忽略种类变量（species variable），仅仅使用每个植物的物理测度来聚类。所需的代码是：

set.seed(1234)

fit <- kmeans(iris[1:4], 3)

对象fit中包含的信息是什么？kmeans()函数的帮助页面表明该函数返回一个包含七种成分的列表。str()函数展示了对象的结构，unclass()函数用来直接检查对象的内容。length()函数展示对象包含多少成分，names()函数提供了这些成分的名字。你可以使用attributes()函数来检查对象的属性。下面探讨通过kmeans()得到的对象内容：

names(fit)

unclass(fit)

执行sapply(fit, class)返回该类每个成分的对象：

sapply(fit, class)

cluster是包含集群成员的整数向量，centers是包含聚类中心的矩阵（各个类中每个变量的均值）。size是包含三类中每一类植物的整数向量。

本文来自博客园，作者：zhang-X，转载请注明原文链接：https://www.cnblogs.com/YY-zhang/p/15154189.html

原文地址：https://www.cnblogs.com/YY-zhang/p/15154189.html