论文摘要
由于用于构建卷积神经网络(CNNs)的各个模块具有较为固定的几何结构,从而在根本上限制了 CNNs 算法对几何变换的建模。雷锋网了解到,在《Deformable Convolutional Networks》这篇论文中,来自微软亚洲研究院的研究员们提出了两种全新的模块 Deformable convolution 和 Deformable RoI pooling 用于提升 CNNs 算法对几何变换的建模能力。
Deformable convolution 和 Deformable RoI pooling 两种模块构建的思想分别是:
在提供了额外偏移的情况下增加模块中的空间采样位置(见 Figure 2);
在没有额外监督的情况下从目标任务学习偏移(见 Figure 3)。
值得一提的是,这两个模块都可以轻而易举地取代现有卷积神经网络(CNNs)中的相对应模块,并且也可以通过标准的反向传播算法进行端到端(End-to-End)的训练从而产生可变形的卷积网络(Deformable convolutional networks)。
上图中(a)展示了传统卷积操作中两层固定的感受野,而(b)展示可变形卷积操作中两层可自适应的感受野。(a)与(b)两图遵循相同的结构,自上而下分别是:1、最顶层的图片中展示两个激活单元,它们分位于不同形状与大小的物体中,而它们的输入来自于一个3x3大小的滤波器;2、中间的图片展示了两个3x3大小的滤波器在前一个特征图(feature map)上的采样位置,并且其中依然有两个激活单元被高亮出来;3、最底层的图片中展示了在前一个特征图上两个层级的3x3大小的滤波器的采样位置,其中有两组采样位置被高亮出来,它们分别对应于上一层图片中的高亮单元。
据雷锋网了解,微软亚洲研究院的研究员们已经通过大量的实验验证了该新方法对于物体检测和语义分割这两个复杂视觉任务具有有效性,并且相关的实验代码也将被公开出来。
via Deformable Convolutional Networks,雷锋网编译
相关资讯
最新热门应用
热币交易所最新版本app
其它软件287.27 MB
下载uni交易所app
其它软件106.98M
下载抹茶交易所bzz
其它软件137MB
下载比特国际数字资产交易所app
其它软件163.20M
下载安银网上交易平台app官网
其它软件223.89MB
下载比特国际数字货币交易所app安卓
其它软件179MB
下载芝麻交易所app官方最新版本
其它软件223.89MB
下载币万交易所app官方
其它软件34.95 MB
下载大币网交易所官网最新版安卓版
其它软件16.54 MB
下载欧联交易所官网版安卓
其它软件34.95 MB
下载