谷歌开放的TensorFlow Object Detection API 效果如何？对业界有什么影响？

熟悉TensorFlow的人都知道，tf在Github上的主页是： https://github.com/tensorflow ，然后这个主页下又有两个比较重要的repo（看star数就知道了），分别是TensorFlow的源代码repo：tensorflow/tensorflow，还有一个tensorflow/models。

后者tensorflow/models是Google官方用TensorFlow做的各种各样的模型，相当于示例代码，比如用于图像分类的Slim，深度文字OCR，以及用于NLP任务的句法分析模型syntaxnet，Seq2Seq with Attention等等等等。这次公布的Object Detection API同样是放在了tensorflow/models里。

再来说下这次公布的代码的实现方式。首先，对于目标检测这个任务来说，前面必须有一个像样的ImageNet图像分类模型来充当所谓的特征提取（Feature Extraction）层，比如VGG16、ResNet等网络结构。TensorFlow官方实现这些网络结构的项目是TensorFlow Slim，而这次公布的Object Detection API正是基于Slim的。Slim这个库公布的时间较早，不仅收录了AlexNet、VGG16、VGG19、Inception、ResNet这些比较经典的耳熟能详的卷积网络模型，还有Google自己搞的Inception-Resnet，MobileNet等。

我们在TensorFlow Object Detection API的官方安装指南中，可以看到这样一句代码：

很显然，这就是钦点用Slim作特征抽取了。

另外，以Faster RCNN为例，之前在github上，可以找到各种各样非官方的TensorFlow实现，但是这些实现使用的特征抽取层都不是Slim，而是五花八门的什么都有，另外一方面实现代码大量copy自原始的caffe的实现，这次公布的代码里已经一点也找不到原始caffe实现的痕迹了。

最后，原来非官方的Object Detection实现的质量参差不齐，去年我调过一个Faster RCNN，过程比较痛苦，在运行之前疯狂debug了三天才勉强跑了起来。这次Google官方公布的Object Detection API别的不说，代码质量肯定是过的去的，因此以后应该不会有人再造TensorFlow下Faster RCNN、R-FCN、SSD的轮子了。

说完了代码，再简单来说下公布的模型。主要公布了5个在COCO上训练的网络。网络结构分别是SSD+MobileNet、SSD+Inception、R-FCN+ResNet101、Faster RCNN+ResNet101、Faster RCNN+Inception_ResNet。后期应该还会有更多的模型加入进来。