目前我们常用的神经网络github上基夲都具有较为丰富的训练、测试代码,我们这里选择几种常用高效的网络推荐给大家,包括与之对应的github工程涉及一些训练的技巧,旨茬让大家能够复现出作者原始的精度
我们这里主要介绍以下几个网络的训练与使用:
以上这些网络涵盖了日常使用网络设计到的大部分功能,一些相关的应用也可以通过这些网络的变通修改进行试验。
MobileNet是谷歌发布的第一代专为移动端设计的高效网络其后续版本MobileNet-v2同样优秀,shicai yang大神已经给出了网络的pretrain model以及caffe的,利用该网络可以训练其他类似的分类任务例如我们开源的.
MnasNet同样是谷歌发布的高效移动端分类网络,與Mobilenet不同之处在于网络的设计借助deepmind AI的能力不是hand craft手动设计的网络,相比于mobilenet速度快大约1.5倍,准确度提高将近两个点我们同样复现了该网络,并且提供了该网络再标准ImageNet上的pretrain model接近了官方的精度。连接地址:
MTCNN是一个非常优秀的单一物体检测框架可以用这个框架进行人脸检测、車辆、行人等单一物体的检测,该网络的主要问题在于单帧图像中包含多个物体时检测速度下降严重。mtcnn的复现在github上有多个版本包括caffe、keras、TensorFlow等,我们测试了不同版本有一些存在问题, 这个repo能够基本复现作者的精度其实,mtcnn框架具有一些优化的方法和空间包括用卷积替代polling,采用dw卷积等等相关修改可以参考我们的文章: . 我们的工程师同样提供了一个优化的mtcnn模型: ,大家可以参考修改
SSD是Single Shot检测网络的代表结构,其速度快单帧物体数量对检测速度影响不大,具有很好的工程化指导作用Mobilenet跟SSD的结合,更能够提高网络的速度Mobilenet-SSD可以参考: 这里有数據准备代码,以及网络的训练测试代码我们采用这个网络进行了车牌检测的实验,效果也不错能够完成单层、双层、蓝牌、黄牌、绿牌的检测,可以参见我们的博客:
通用物体检测近年来也是研究人员关注的人们领域从RBG、何凯明大神的RCNN,Fast RCNNFaster RCNN,MASK RCNN等Single Shot的Yolo系列、SSD等,以后后來的RetinaNet我们对这一系列的网络都进行过测试,由于我们算法组在日常使用中主要考虑移动端的部署以及服务器端的效率推荐了MobileNet-SSD跟YOLO-V
3。我们對3000张行车记录仪标注图像以及2000张交通监控图片进行标注分别在以上网络进行了测试,对于我们的图片YOLO-V3表现最好,速度也是最快的一档项目主页: