Torch7搭建卷积神经网络详细教程

(如果有好的建议和问题欢迎在留言区指出)

之前的博文，如一文读懂卷积神经网络(CNN)、多层网络与反向传播算法详解、感知机详解、卷积神经网络详解等已经比较详细的讲述了神经网络以及卷积神经网络的知识。本篇博文主要讲述在Torch7中神经网络如何建立以及相关的原理（即神经网络包NN的内容），虽然讲述的是神经网络的建立。但是不会涉及太多神经网络的知识，假如你对该领域不是很了解，可以去之前的几篇博文里面充充电。

首先简单的介绍一下Torch7中的神经网络工具包，该包是由不同的模块组合而成。NN包中最底层是一个叫Module的抽象模块，Container是对其功能扩展的子模块，Sequential、Parallel和Concat是继承于Container最重要的三个子模块，所构成的神经网络既可以包括简单层，如Linear、Mean、Max和Reshape等，也可以包括卷基层以及激活函数等。通过这些类可以构成神经网络的架构，但是关于如何训练需要一个性能指标也就是损失函数，在NN中损失函数定义在Criterion模块中，常用的损失函数有MSECriterion (均方根误出)、ClassNLLCriterion (交叉熵)。很自然的，有了性能指标之后我们需要考虑如何优化该性能指标，这儿分为两种，一种是使用Torch7内部的优化函数包Optim来优化（简单，上手快），另一种则是采用迭代法更新权值（该方法一般用于简单的网络，当存在卷积层时，优化困难），推荐使用Optiml来优化。

在了解了NN包的组成模块后，让我们详细的了解一下Module模块。上面我们说到NN有不同的模块组成，这些模块有的有参数，有的无参数，但是都有输入dLoss_dInput和输出dLoss_dOutput（除输入层模块和输出层模块以外）；对于那些有参数的模块而言需要计算dLoss_dParams,该参数其实包括两部分，一部分是权值，即dLoss_dWeight，另一部分是偏置，即dLoss_dBias.

在Module中定义了四个基本函数方法，如下所示：

--1. forward(input) 根据输入计算module的输出;

--2. backward(input, gradOutput) 该函数利用反向传播(BP算法原理充电的点这儿脉络清晰的BP神经网络讲解)更行网络内部的权值，其中gradOutput即上述的dLoss_dOutput；

--3. zeroGradParameters() 用于权值迭代更新，用到的概率比较小；

--4. updateGradParameters(learningRate) 用于迭代更新内部权值，后面详细讲解；

下面让我们一起动手尝试如何构建神经网络的架构

在搭建之前先看一下卷积神经网络的架构，如下所示。