深度学习CNN眼中的图片是什么样的
2017年最后一天,无心学习。本来想休息下的,结果看到了一篇Paper叫《Visualizing and Understanding Convolutional Networks》,比较老13年发的,但是蛮有趣的,因为通常人们做深度学习训练的时候其实是在一个黑盒环境下进行,人们也不知道模型的每一层是怎么完成图片识别的,那这篇文章给了一个很好的解释,于是就读了下,顺便也跟大家分享。
正文
大家都知道深度学习,特别是CNN结构的模型有一个很神奇的功能:可以识别图片。有一些生物尝试的同学可能了解,人脸通过眼睛对图片进行识别其实是要经过大脑皮层上千万个神经元的判别。那么在CNN网络中,算法模型是怎么对于物品进行识别的呢,首先来看这张图:
其实模型对于图片的识别跟人脑是近似的,选取了一个CNN模型中的三层Layer,每个Layer左边的黑色的小方块是每一个feature map,可以理解为一个个小的神经元。右边的是随机选取的跟feature map对应的图片。我们可以看到,在模型比较初期的Layer1,只能识别出一些图片的菱角,也就是横、竖或者斜线。到了Layer2可以识别出一些形状,到了Layer3甚至可以识别出一些纹路。经过逐层的抽象,使得图片识别结果逐渐清楚。于是我们大致了解了模型的整个识别流程,是跟人的大脑近似的,是通过多层次的不断叠加的认知来识别图片。接下来我们看下CNN在识别图像过程中还有哪些特性。
越高层级的模型对于图像变化的感知越不敏感
图a、b、c是三种图像形式的图片表示:a是原图,b是图片的分辨率降低,c是图片翻转。通过对于图片不同的变化的比较,发现Layer越低的层级对于图片变换的感知越明显。如果是高Layer的层级,那么图片翻转或者清晰度变化对于识别影响不大。也就是说我们在训练CNN模型的时候,要适当增加层数。
关键位置的特征是否清晰对于识别非常重要
看上图左边以及它在算法计算过程中的feature map(右边),我们看到蓝色的热力图部位对应的位置差不多是狗的脸,也就是说算法在识别这张图是什么的时候主要检查的是脸部部位。
再看上面的这张图,蓝色热力图表示的是车的文字的牌子处,但是我们的输入图片牌子处被灰色方块遮挡,导致识别错误,这张图片返回结果是车轮,本来应该是车牌。也就是说图片的关键位置特征是最决定一张图片的识别精度的,比如我们做人脸识别,可能鼻子、眼睛、嘴这些就是关键特征,而图片的背景对于结果影响不大。以上论证可以通过下面的图来充分展示:
如果我们做一个狗的图片识别,挡住狗的眼睛、鼻子对于图片的识别准确度影响要远大于随机挡住一块背景。
PS:想自己研究研究的同学可以去下载这篇论文,我觉得还挺有趣的。另外,元旦我要出去浪3天,请假请假!感谢2017年大家的陪伴,2018年要更充实。
End
- 微信JSSDK接入Java版--步骤及问题处理和解决
- 微信企业号回调模式配置讲解 Java Servlet+Struts2版本 echostr校验失败解决
- Android Material Design系列之RecyclerView和CardView
- 在Linux安装ASP.Net Core的运行时(Runtime)
- 使用xUnit为.net core程序进行单元测试(下1)
- Otto开发初探——微服务依赖管理新利器
- Apache Eagle——eBay开源分布式实时Hadoop数据安全方案
- Spring/Hibernate 应用性能优化的7种方法
- 浅谈应用型机器学习作为一种搜索问题
- 自相关和偏自相关的简单介绍
- 机器学习中分类与回归的差异
- 自然语言处理指南(第1部分)
- GreenDao 兼容升级,保留旧数据的---全方面解决方案
- 基于 xorm 的服务端框架 XGoServer
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法