Machine Learning in Action ---- kNN
时间:2019-11-15
本文章向大家介绍Machine Learning in Action ---- kNN,主要包括Machine Learning in Action ---- kNN使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
------------恢复内容开始------------
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Thu Nov 14 19:29:08 2019 4 5 @author: HTING 6 """ 7 8 # 导入科学计算包模块 9 import numpy as np 10 11 # 导入运算符模块 12 import operator 13 14 # ============================================================================= 15 # # 导入 os 模块 16 # import os 17 # ============================================================================= 18 19 # 创建数据集和标签 20 def createDataSet(): 21 group = np.array([[1.0, 1.1], 22 [1.0, 1.0], 23 [0, 0], 24 [0, 0.1]]) 25 labels = ('A', 'A', 'B', 'B') 26 27 return group, labels 28 29 30 31 ''' 32 33 Parameters: 34 35 inX - 用于分类的数据(测试集) 36 dataSet - 用于训练的数据(训练集) 37 labes - 训练数据集的label 38 k - 选择距离最小的k个点 39 40 return: 41 42 sortedClassCount[0][0] - 输入数据的预测分类 43 44 ''' 45 46 # k-近邻算法 47 48 def classify0(inX, k): 49 50 # import dataSet, labels 51 dataSet, labels = createDataSet() 52 53 # 计算距离 54 # A.shape[i] : 第i维的长度 55 dataSetSize = dataSet.shape[0] 56 57 # 用tile将输入向量复制成和数据集一样大的矩阵 58 ''' 59 np.tile(A, reps) : 60 数组A重复一定次数获得新数组; 61 A - array, list, tuple, dict, matrix 62 以及基本数据类型int, string, float以及bool类型; 63 reps - tuple,list, dict, array, int, bool. 64 但不可以是float, string, matrix类型; 65 66 np.tile(A,(m,n)): 67 数组A重复n次 --> nA; # A重复n次 68 nA --> m[nA]. # m 维的nA 69 ''' 70 diffMat = np.tile(inX, (dataSetSize,1)) - dataSet 71 sqDiffMat = diffMat ** 2 72 73 ''' 74 In Numpy dimensions are called axes. 75 The number of axes is rank. 76 77 ''' 78 sqDistances = sqDiffMat.sum(axis=1) 79 # sqDistances = np.sum(sqDiffMat, axis=1) 80 81 distances = sqDistances ** 0.5 82 83 # 按距离从小到大排序,并返回相应的索引位置 84 # A.argsort()[] 85 sortedDistIndicies = distances.argsort() 86 87 88 # 创建一个字典,存储标签和出现次数 89 classCount = {} 90 91 # 选择距离最小的k个点 92 for i in range(k): 93 ''' 94 for i in range(m,n,z) | range(start, stop, step) 95 i <--> m -> n-1, step = z; 96 default: m = 0, z = 1 97 ''' 98 # 查找样本的标签类型 99 voteIlabel = labels[sortedDistIndicies[i]] 100 101 # 在字典中给找到的样本标签类型+1 102 ''' 103 若不存在voteIlabel, 104 则字典classCount中生成voteIlabel元素,并使其对应的数字为0 : 105 : classCount = {voteIlabel:0} 106 此时classCount.get(voteIlabel,0)作用是检测并生成新元素,括号中的0只用作初始化,之后再无作用; 107 当字典中有voteIlabel元素时, 108 classCount.get(voteIlabel,0)作用是返回该元素对应的值 109 ''' 110 classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1 111 112 # 排序并返回出现次数最多的标签类型 113 ''' 114 sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list 115 cmp -- accept function; 116 key -- accept one element of one function, which is function return , 117 the weight to sort; 118 reverse -- True -> positive order; 119 False -> negative order; 120 121 operator.itemgetter() 122 用于获取对象的哪些维的数据,参数为一些序号。 123 注,operator.itemgetter函数获取的不是值,而是定义了一个函数,通过该函数作用到对象上才能获取值。 124 ''' 125 sortedClassCount = sorted(classCount.items(),key=operator.itemgetter(1), reverse=True) 126 127 return sortedClassCount[0][0] 128 129 130
原文地址:https://www.cnblogs.com/HH520ting/p/11866679.html
- LegacyText的复制的Bug
- 提高WCF服务并发能力的简单处理办法
- 如何给已经有数据的DataTable动态增加一列并赋值
- Gitlab上采用rpm方式快速安装的操作记录
- WCF与IIS集成Windows身份验证的矛盾
- openstack中彻底删除计算节点的操作记录
- 验证码无刷新更换
- 从MapX到MapXtreme2004[12]-SearchNearest!
- Sublime Text的安装与配置
- 复制到浮动层,强调显示某个(多个)区域
- Jquery实现的一种常用高亮效果
- MaCfee导致Asp.net/Jmail无法发送邮件的解决办法
- 水晶报表文本在web中无法两端对齐
- jenkins配置记录(2)--代码发布流程
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 关于php的引用
- Windows 开机自启 VMware 虚拟机
- Alertmanager 安装与使用
- typedef用法
- LaTex中插入大括号的多行公式
- Latex公式编辑和子公式编辑
- nginx rewrite 跨域
- Oracle删除索引规范
- mysql中走与不走索引的情况汇集(待全量实验)
- C#标准事件流
- 【STM32F407开发板用户手册】第25章 STM32F407的TIM定时器基础知识和HAL库API
- 【STM32F429开发板用户手册】第25章 STM32F429的TIM定时器基础知识和HAL库API
- AkShare-债券数据-全球债券行情
- AkShare-指数数据-全球指数
- AkShare-股票数据-机构推荐