萌新向Python数据分析及数据挖掘 第三章 机器学习常用算法 第一节 KNN算法 (上)理解篇

时间:2019-04-18
本文章向大家介绍萌新向Python数据分析及数据挖掘 第三章 机器学习常用算法 第一节 KNN算法 (上)理解篇,主要包括萌新向Python数据分析及数据挖掘 第三章 机器学习常用算法 第一节 KNN算法 (上)理解篇使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

理解
用一个实际生活的例子来解释
假设你面前有一堆男人
分类问题:
这些男人的基本信息全部掌握,有一些是渣男,有一些是好男人,有一些是正常人
现在新来了几个男人,基本信息全部掌握,没有标注男人类型,需要从已知的男人作为参考,判断新来的男人的类型
KNN的思想就是:对每一个新来的男人,找出和他基本信息最相近的K个男人,看看他们这几个接近的男人的类型,然后以最多的类型作为预测
回归问题:
这些男人的基本信息全部掌握,包括他们的年收入
现在新来了几个男人,基本信息全部掌握,不包括年收入
KNN的思想就是:对每一个新来的男人,找出和他基本信息最相近的K个男人,看看他们这几个接近的男人的年收入,然后以平均数或加权平均数作为预测
训练测试分离
在给新来的男人预测时,先把原有的男人打乱顺序,随机抽取一定比例作为练习,看看自己看男人的眼光是否准确,再来对付新来的男人
超参数
k
选几个最相近的男人作为参考
权重
对于挑出来参考的这几个男人 更着重参考最接近的
p
评价最相近时使用闵科夫斯基距离的次方数