在本文中,我们介绍了ML-解码器,是一种基于新的关注的分类头。 ML-解码器通过查询预测类标签的存在,与全局平均池相比,能够更好地利用空间数据。通过重新设计解码器架构,并使用新颖的组解码方案,ML-Decoder是高效的,并且可以缩放到数千个类。与使用较大的骨架相比,ML-解码器一致地提供更好的速度准确性权衡。 ML-Decoder也是多功能的 - 它可以用作各种分类头的替代品,并在用Word查询操作时概括到未经看的类。新型查询增强进一步提高了其泛化能力。使用ML-Decoder,我们实现了最先进的结果:在MS-Coco多标签上,我们达到91.4%地图;在Nus宽零点上,我们达到31.1%ZSL地图;在Imagenet单一标签上,我们与Vanilla Reset50骨干骨架达到80.7%的新顶级得分,无需额外的数据或蒸馏。公共代码可在:https://github.com/alibaba-miil/ml_decoder
translated by 谷歌翻译