智能论文笔记

Neural Wavelet-domain Diffusion for 3D Shape Generation

Ka-Hei Hui , Ruihui Li , Jingyu Hu , Chi-Wing Fu

分类：计算机视觉

2022-09-19

本文提出了一种新的3D形状生成方法，从而在小波域中的连续隐式表示上实现了直接生成建模。具体而言，我们提出了一个带有一对粗糙和细节系数的紧凑型小波表示，通过截短的签名距离函数和多尺度的生物联盟波波隐式表示3D形状，并制定了一对神经网络：基于生成器基于扩散模型的生成器以粗糙系数的形式产生不同的形状；以及一个细节预测因子，以进一步生成兼容的细节系数量，以丰富具有精细结构和细节的生成形状。定量和定性实验结果都表现出我们的方法在产生具有复杂拓扑和结构，干净表面和细节的多样化和高质量形状方面的优势，超过了最先进的模型的3D生成能力。

translated by 谷歌翻译

HOPE: Hierarchical Spatial-temporal Network for Occupancy Flow Prediction

Yihan Hu , Wenxin Shao , Bo Jiang , Jiajie Chen , Siqi Chai , Zhening Yang , Jingyu Qian , Helong Zhou , Qiang Liu

分类：计算机视觉

2022-06-21

在本报告中，我们在CVPR 2022的Waymo Open数据集挑战中介绍了解决方案和流程预测挑战，该挑战在排行榜上排名第一。我们已经开发了一个新型的层次空间时间网络，该网络具有时空编码器，一个富含潜在变量的多尺度聚合器以及一个递归层次结构3D解码器。我们使用多种损失，包括局灶性损失和修改的流量损失来有效指导训练过程。我们的方法达到了一个占地0.8389的流动占用AUC，并且优于排行榜上所有其他团队。

translated by 谷歌翻译

Neural Template: Topology-aware Reconstruction and Disentangled Generation of 3D Meshes

Ka-Hei Hui , Ruihui Li , Jingyu Hu , Chi-Wing Fu

分类：计算机视觉

2022-06-10

本文介绍了一个名为DTNET的新颖框架，用于3D网格重建和通过Distangled Tostology生成。除了以前的工作之外，我们还学习一个特定于每个输入的拓扑感知的神经模板，然后将模板变形以重建详细的网格，同时保留学习的拓扑。一个关键的见解是将复杂的网格重建分解为两个子任务：拓扑配方和形状变形。多亏了脱钩，DT-NET隐含地学习了潜在空间中拓扑和形状的分离表示。因此，它可以启用新型的脱离控件，以支持各种形状生成应用，例如，将3D对象的拓扑混合到以前的重建作品无法实现的3D对象的拓扑结构。广泛的实验结果表明，与最先进的方法相比，我们的方法能够产生高质量的网格，尤其是具有不同拓扑结构。

translated by 谷歌翻译

Automatic Routability Predictor Development Using Neural Architecture Search

Chen-Chia Chang , Jingyu Pan , Tunhou Zhang , Zhiyao Xie , Jiang Hu , Weiyi Qi , Chun-Wei Lin , Rongjian Liang , Joydeep Mitra , Elias Fallon

分类：机器学习

2020-12-03

机器学习技术的兴起激发了电子设计自动化（EDA）中应用的繁荣，有助于提高芯片设计中的自动化程度。然而，手动制作的机器学习模型需要广泛的人类专业知识和巨大的工程努力。在这项工作中，我们利用神经结构搜索（NAS）来自动开发高质量的神经架构进行可排卵预测，这有助于引导细胞放置到可路由解决方案。我们的搜索方法支持各种操作和高度灵活的连接，导致架构与所有先前的人工制作模型显着不同。大型数据集上的实验结果表明，我们的自动生成神经架构明显优于多个代表手动制作的解决方案。与手动制作型号的最佳案例相比，NAS产生的模型达到了5.85％的kendall的$ \ tau $，以预测DRC违规的网数和ROC曲线（ROC-AUC）在DRC热点检测下的2.12％面积。此外，与人工制作的模型相比，易于花数周开发，我们的高效NAS方法只需0.3天即可完成整个自动搜索过程。

translated by 谷歌翻译

On the Blind Spots of Model-Based Evaluation Metrics for Text Generation

Tianxing He , Jingyu Zhang , Tianle Wang , Sachin Kumar , Kyunghyun Cho , James Glass , Yulia Tsvetkov

分类：自然语言处理

2022-12-20

In this work, we explore a useful but often neglected methodology for robustness analysis of text generation evaluation metrics: stress tests with synthetic data. Basically, we design and synthesize a wide range of potential errors and check whether they result in a commensurate drop in the metric scores. We examine a range of recently proposed evaluation metrics based on pretrained language models, for the tasks of open-ended generation, translation, and summarization. Our experiments reveal interesting insensitivities, biases, or even loopholes in existing metrics. For example, we find that BERTScore ignores truncation errors in summarization, and MAUVE (built on top of GPT-2) is insensitive to errors at the beginning of generations. Further, we investigate the reasons behind these blind spots and suggest practical workarounds for a more reliable evaluation of text generation.

translated by 谷歌翻译

Real-RawVSR: Real-World Raw Video Super-Resolution with a Benchmark Dataset

Huanjing Yue , Zhiming Zhang , Jingyu Yang

分类：计算机视觉

2022-09-26

近年来，由于SR数据集的开发和相应的实际SR方法，真实的图像超分辨率（SR）已取得了令人鼓舞的结果。相比之下，真实视频SR领域落后，尤其是对于真实的原始视频。考虑到原始图像SR优于SRGB图像SR，我们构建了一个真实世界的原始视频SR（Real-Rawvsr）数据集，并提出了相应的SR方法。我们利用两个DSLR摄像机和一个梁切口来同时捕获具有2倍，3倍和4倍大型的高分辨率（LR）和高分辨率（HR）原始视频。我们的数据集中有450对视频对，场景从室内到室外各不相同，包括相机和对象运动在内的动作。据我们所知，这是第一个现实世界的RAW VSR数据集。由于原始视频的特征是拜耳模式，因此我们提出了一个两分支网络，该网络既涉及包装的RGGB序列和原始的拜耳模式序列，又涉及两个分支，并且两个分支相互互补。经过提出的共对象，相互作用，融合和重建模块后，我们生成了相应的HR SRGB序列。实验结果表明，所提出的方法优于原始或SRGB输入的基准实体和合成视频SR方法。我们的代码和数据集可在https://github.com/zmzhang1998/real-rawvsr上找到。

translated by 谷歌翻译

Convolutional Bayesian Kernel Inference for 3D Semantic Mapping

Joey Wilson , Yuewei Fu , Arthur Zhang , Jingyu Song , Andrew Capodieci , Paramsothy Jayakumar , Kira Barton , Maani Ghaffari

分类：机器人 | 计算机视觉

2022-09-21

机器人的感知目前处于在有效的潜在空间中运行的现代方法与数学建立的经典方法之间的跨道路，并提供了可解释的，可信赖的结果。在本文中，我们引入了卷积的贝叶斯内核推理（Convbki）层，该层在可分离的卷积层中明确执行贝叶斯推断，以同时提高效率，同时保持可靠性。我们将层应用于3D语义映射的任务，在该任务中，我们可以实时学习激光雷达传感器信息的语义几何概率分布。我们根据KITTI数据集的最新语义映射算法评估我们的网络，并通过类似的语义结果证明了延迟的提高。

translated by 谷歌翻译

Prediction of Gender from Longitudinal MRI data via Deep Learning on Adolescent Data Reveals Unique Patterns Associated with Brain Structure and Change over a Two-year Period

Yuda Bi , Anees Abrol , Zening Fu , Jiayu Chen , Jingyu Liu , Vince Calhoun

分类：计算机视觉 | 机器学习

2022-09-15

用于预测神经影像数据的深度学习算法在各种应用中显示出巨大的希望。先前的工作表明，利用数据的3D结构的深度学习模型可以在几个学习任务上胜过标准机器学习。但是，该领域的大多数先前研究都集中在成年人的神经影像学数据上。在一项大型纵向发展研究的青少年大脑和认知发展（ABCD）数据集中，我们检查了结构性MRI数据，以预测性别并确定与性别相关的大脑结构变化。结果表明，性别预测准确性异常高（> 97％），训练时期> 200，并且这种准确性随着年龄的增长而增加。大脑区域被确定为研究的任务中最歧视性的，包括主要的额叶区域和颞叶。当评估年龄增加两年的性别预测变化时，揭示了一组更广泛的视觉，扣带和孤立区域。我们的发现表明，即使在较小的年龄范围内，也显示出与性别相关的结构变化模式。这表明，通过查看这些变化与不同的行为和环境因素如何相关，可以研究青春期大脑如何变化。

translated by 谷歌翻译

Stochastic Tree Ensembles for Estimating Heterogeneous Effects

Nikolay Krantsevich , Jingyu He , P. Richard Hahn

分类： (统计)机器学习 | 机器学习

2022-09-15

确定对特定干预措施（医疗或政策）响应特别好（或不良）的亚组，需要专门针对因果推理量身定制的新监督学习方法。贝叶斯因果森林（BCF）是一种最近的方法，已被记录在数据生成过程中，具有强烈混杂的方法，这种方法在许多应用中都具有合理的方式。本文开发了一种用于拟合BCF模型的新型算法，该算法比先前可用的Gibbs采样器更有效。新算法可用于初始化现有Gibbs采样器的独立链，从而使模拟研究中相关间隔估计值的后验探索和覆盖率更好。通过模拟研究和经验分析将新算法与相关方法进行比较。

translated by 谷歌翻译

Prototype-Aware Heterogeneous Task for Point Cloud Completion

Junshu Tang , Jiachen Xu , Jingyu Gong , Haichuan Song , Yuan Xie , Lizhuang Ma

分类：计算机视觉

2022-09-05

点云完成旨在从部分点云中恢复原始形状信息，引起了人们对3D Vision社区的关注。现有方法通常成功完成标准形状，同时未能生成某些非标准形状的点云的本地细节。为了获得理想的当地细节，全球形状信息的指导至关重要。在这项工作中，我们设计了一种有效的方法来借助类内部形状的原型表示区分标准/非标准形状，可以通过建议的监督形状聚类借口任务来计算，从而导致异构组件W.R.T完成网络。代表性的原型（定义为形状类别的特征质心）可以提供全局形状的指导，该指南被称为软性知识，以多尺度方式通过所需的选择性感知特征融合模块注入下游完成网络。此外，要进行有效的培训，我们考虑了基于困难的采样策略，以鼓励网络更多地关注一些部分点云，而几何信息较少。实验结果表明，我们的方法表现优于其他最新方法，并且具有完成复杂几何形状的强大能力。

translated by 谷歌翻译