最近已经提出了方法,仅使用稀疏语义注释像素的形式使用颜色图像和专家监督,将密度段3D卷成类。尽管令人印象深刻,但这些方法仍然需要相对较大的监督和对象进行分割可能需要几分钟的实践。这样的系统通常仅在其拟合的特定场景上优化其表示形式,而无需利用先前看到的图像中的任何先前信息。在本文中,我们建议使用在大型现有数据集中训练的模型提取的功能,以提高细分性能。我们通过体积渲染特征图和从每个输入图像提取的特征进行监督,将此特征表示形式烘烤到神经辐射场(NERF)中。我们表明,通过将此表示形式烘烤到NERF中,我们可以使后续的分类任务更加容易。我们的实验表明,与在各种场景中现有方法相比,我们的方法具有更高的分割精度,语义注释较少。
translated by 谷歌翻译