智能论文笔记

Computing High-Quality Solutions for the Patient Admission Scheduling Problem using Evolutionary Diversity Optimisation

Adel Nikfarjam , Amirhossein Moosavi , Aneta Neumann , Frank Neumann

分类：神经与进化计算

2022-07-28

一组解决方案中的多元化已成为进化计算社区中的热门研究主题。事实证明，它有益于以多种方式优化问题，例如计算一套高质量的解决方案并获得不完美建模的鲁棒性。在文献中，我们首次适应了现实世界中的组合问题的进化多样性优化，即患者的入学计划。我们引入了一种进化算法，以在每种溶液质量的一组解决方案中实现结构多样性。我们还引入了一个突变操作员，偏向于多样性最大化。最后，我们通过模拟证明了多样性对上述问题的重要性。

translated by 谷歌翻译

StyleGAN as a Utility-Preserving Face De-identification Method

Seyyed Mohammad Sadegh Moosavi Khorzooghi , Shirin Nilizadeh

分类：计算机视觉 | 机器学习

2022-12-05

Several face de-identification methods have been proposed to preserve users' privacy by obscuring their faces. These methods, however, can degrade the quality of photos, and they usually do not preserve the utility of faces, e.g., their age, gender, pose, and facial expression. Recently, advanced generative adversarial network models, such as StyleGAN, have been proposed, which generate realistic, high-quality imaginary faces. In this paper, we investigate the use of StyleGAN in generating de-identified faces through style mixing, where the styles or features of the target face and an auxiliary face get mixed to generate a de-identified face that carries the utilities of the target face. We examined this de-identification method with respect to preserving utility and privacy, by implementing several face detection, verification, and identification attacks. Through extensive experiments and also comparing with two state-of-the-art face de-identification methods, we show that StyleGAN preserves the quality and utility of the faces much better than the other approaches and also by choosing the style mixing levels correctly, it can preserve the privacy of the faces much better than other methods.

translated by 谷歌翻译

Fast-Image2Point: Towards Real-Time Point Cloud Reconstruction of a Single Image using 3D Supervision

AmirHossein Zamani , Amir G. Aghdam , Kamran Ghaffari T

分类：计算机视觉

2022-09-20

3D重建问题中的一个关键问题是如何训练机器人或机器人以模型3D对象。在实时系统（例如自动驾驶汽车）中导航等许多任务直接取决于此问题。这些系统通常具有有限的计算能力。尽管近年来3D重建系统在3D重建系统中取得了长足的进展，但由于现有方法的高复杂性和计算需求，将它们应用于自动驾驶汽车中的导航系统等实时系统仍然具有挑战性。这项研究解决了以更快（实时）方式重建单视图像中显示的对象的当前问题。为此，开发了一个简单而强大的深度神经框架。提出的框架由两个组件组成：特征提取器模块和3D发电机模块。我们将点云表示为我们的重建模块的输出。将Shapenet数据集用于将方法与计算时间和准确性方面的现有结果进行比较。模拟证明了所提出的方法的出色性能。索引术语现实时间3D重建，单视图重建，监督学习，深神经网络

translated by 谷歌翻译

Value Summation: A Novel Scoring Function for MPC-based Model-based Reinforcement Learning

Mehran Raisi , Amirhossein Noohian , Luc Mccutcheon , Saber Fallah

分类：机器学习 | 机器人

2022-09-16

本文为基于MPC的基于MPC模型的增强学习方法的计划模块提出了一个新的评分功能，以解决使用奖励功能得分轨迹的固有偏见。所提出的方法使用折现价值和折扣价值提高了现有基于MPC的MBRL方法的学习效率。该方法利用最佳轨迹来指导策略学习，并根据现实世界更新其状态行动价值函数，并增强板载数据。在选定的Mujoco健身环境中评估了所提出方法的学习效率，以及在学习的模拟机器人模型中学习运动技能。结果表明，所提出的方法在学习效率和平均奖励回报方面优于当前的最新算法。

translated by 谷歌翻译

Will there be a construction? Predicting road constructions based on heterogeneous spatiotemporal data

Amin Karimi Monsefi , Sobhan Moosavi , Rajiv Ramnath

分类：机器学习

2022-09-14

道路建设项目维护运输基础设施。这些项目的范围从短期（例如，重新铺面或固定坑洼）到长期（例如，添加肩膀或建造桥梁）。传统上，确定下一个建设项目是什么以及安排什么何时进行安排，这是通过人类使用特殊设备的检查来完成的。这种方法是昂贵且难以扩展的。另一种选择是使用计算方法来整合和分析多种过去和现在的时空数据以预测未来道路构建的位置和时间。本文报告了这种方法，该方法使用基于深神经网络的模型来预测未来的结构。我们的模型在由构造，天气，地图和道路网络数据组成的异质数据集上应用卷积和经常性组件。我们还报告了如何通过构建一个名为“美国建设”的大型数据集来解决我们如何解决足够的公开数据，其中包括620万个道路构造案例，并通过各种时空属性和路线网络功能增强，收集了。在2016年至2021年之间的连续美国（美国）中。使用对美国几个主要城市进行广泛的实验，我们显示了工作在准确预测未来建筑时的适用性 - 平均F1得分为0.85，准确性为82.2％ - 这是52.2％ - 胜过基线。此外，我们展示了我们的培训管道如何解决数据的空间稀疏性。

translated by 谷歌翻译

Layer or Representation Space:What makes BERT-based Evaluation Metrics Robust?

Doan Nam Long Vu , Nafise Sadat Moosavi , Steffen Eger

分类：自然语言处理

2022-09-06

对文本生成的最新基于嵌入的评估指标的评估主要是基于衡量其与标准基准评估的相关性。但是，这些基准主要是从相似的域到用于浏览单词嵌入的域。这引起了人们对将基于嵌入的指标（缺乏）概括为新的和嘈杂的域的（缺乏）概括，这些指标包含与预处理数据不同的词汇。在本文中，我们研究了BertScore的鲁棒性，BertScore是文本生成最受欢迎的基于嵌入的指标之一。我们表明，（a）基于嵌入的度量与人类在标准基准上具有最高相关性的基于嵌入的度量，如果输入噪声或未知代币的量增加，则具有最低的相关性，（b）从预处理的第一层中嵌入的嵌入模型改善了所有指标的鲁棒性，并且（c）使用字符级嵌入式（而不是基于令牌的嵌入），从预科模型的第一层中实现了最高的鲁棒性。

translated by 谷歌翻译

Transformers with Learnable Activation Functions

Haishuo Fang , Ji-Ung Lee , Nafise Sadat Moosavi , Iryna Gurevych

分类：自然语言处理

2022-08-30

激活功能可以对降低输入数据的拓扑复杂性产生重大影响，从而提高模型的性能。选择合适的激活函数是神经模型设计中的重要步骤。但是，在基于变压器的语言模型中很少讨论或探索激活功能的选择。事先选择它们的激活功能，然后从预训练中固定到微调。结果，在这个漫长的生命周期中，无法调整它们对模型的电感偏见。此外，随后开发的模型（例如Roberta，Bart和GPT-3）经常跟进先前的工作（例如BERT），以使用相同的激活函数而无需合理。在本文中，我们研究了变压器体系结构中使用理性激活函数（RAF）（RAF）的有效性。与常规，预定义的激活功能相反，RAF可以根据输入数据自适应地学习最佳激活功能。我们的实验表明，基于RAF的变压器（RAFT）比具有GELU函数的香草BERT的验证性更低。我们进一步评估了低和全数据设置中下游任务的筏。我们的结果表明，筏在大多数任务和设置上都优于对应模型。例如，在低数据表情况下（有100个训练示例），木筏在胶水基准上的表现平均高出5.71点，在全数据设置的小队中，平均得分为2.05分。对学到的RAF的形状的分析进一步揭示了它们在预训练模型的不同层之间有很大的变化，并且看起来与常规激活函数大多不同。 RAFT为根据学习的激活功能打开了一个新的研究方向，用于分析和解释预训练的模型。

translated by 谷歌翻译

Towards Code Summarization of APIs Based on Unofficial Documentation Using NLP Techniques

AmirHossein Naghshzan

分类：人工智能

2022-08-12

每种编程语言都有官方文档，以指导开发人员使用API，方法和类。但是，在某些情况下，官方文档不是获取所需信息的有效方法。结果，开发人员可以咨询其他来源（例如，堆栈溢出，GitHub），以了解有关API的更多信息，其实施，用法和其他官方文档可能无法提供的信息。在这项研究中，我们提出了一种自动方法，通过使用NLP技术利用非正式文档来生成API和方法的摘要。我们的发现表明，生成的摘要具有竞争力，可以用作指导开发人员在软件开发和维护任务方面的补充来源。

translated by 谷歌翻译

Physics-informed neural networks for diffraction tomography

Amirhossein Saba , Carlo Gigli , Ahmed B. Ayoub , Demetri Psaltis

分类：人工智能

2022-07-28

我们提出了一个具有物理信息的神经网络，作为生物样品层析成像重建的正向模型。我们证明，通过用Helmholtz方程训练该网络作为物理损失，我们可以准确预测散射场。可以证明，可以对不同的样本进行微调的验证网络，并用于与其他数值解决方案更快地解决散射问题。我们通过数值和实验结果评估我们的方法。我们的物理知识神经网络可以推广到任何前进和反向散射问题。

translated by 谷歌翻译

HiFormer: Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation

Moein Heidari , Amirhossein Kazerouni , Milad Soltany , Reza Azad , Ehsan Khodapanah Aghdam , Julien Cohen-Adad , Dorit Merhof

分类：计算机视觉 | 人工智能

2022-07-18

卷积神经网络（CNN）已成为医疗图像分割任务的共识。但是，由于卷积操作的性质，它们在建模长期依赖性和空间相关性时受到限制。尽管最初开发了变压器来解决这个问题，但它们未能捕获低级功能。相比之下，证明本地和全球特征对于密集的预测至关重要，例如在具有挑战性的环境中细分。在本文中，我们提出了一种新型方法，该方法有效地桥接了CNN和用于医学图像分割的变压器。具体而言，我们使用开创性SWIN变压器模块和一个基于CNN的编码器设计两个多尺度特征表示。为了确保从上述两个表示获得的全局和局部特征的精细融合，我们建议在编码器编码器结构的跳过连接中提出一个双层融合（DLF）模块。在各种医学图像分割数据集上进行的广泛实验证明了Hiformer在计算复杂性以及定量和定性结果方面对其他基于CNN的，基于变压器和混合方法的有效性。我们的代码可在以下网址公开获取：https：//github.com/amirhossein-kz/hiformer

translated by 谷歌翻译