智能论文笔记

Non-Line-of-Sight Tracking and Mapping with an Active Corner Camera

Sheila Seidel , Hoover Rueda-Chacon , Iris Cusini , Federica Villa , Franco Zappa , Christopher Yu , Vivek K Goyal

分类：计算机视觉

2022-08-02

在各种领域，包括搜索和救援，自动驾驶汽车导航和侦察的各个领域，形成不断变化的场景的非线图像（NLOS）图像的能力可能具有变革性。大多数现有的活性NLOS方法使用针对继电器表面并收集回返回光的时间分辨测量的脉冲激光来照亮隐藏场景。流行的方法包括对垂直壁上的矩形网格的栅格扫描，相对于感兴趣的数量，以产生共聚焦测量集合。这些固有地受到激光扫描的需求的限制。避免激光扫描的方法将隐藏场景的运动部件作为一个或两个点目标。在这项工作中，基于更完整的光学响应建模，但仍没有多个照明位置，我们演示了运动中对象的准确重建和背后的固定风景的“地图”。计数，本地化和表征运动中隐藏物体的大小，结合固定隐藏场景的映射的能力，可以大大提高各种应用中的室内情况意识。

translated by 谷歌翻译

Iterative regularization in classification via hinge loss diagonal descent

Vassilis Apidopoulos , Tomaso Poggio , Lorenzo Rosasco , Silvia Villa

分类： (统计)机器学习 | 机器学习

2022-12-24

Iterative regularization is a classic idea in regularization theory, that has recently become popular in machine learning. On the one hand, it allows to design efficient algorithms controlling at the same time numerical and statistical accuracy. On the other hand it allows to shed light on the learning curves observed while training neural networks. In this paper, we focus on iterative regularization in the context of classification. After contrasting this setting with that of regression and inverse problems, we develop an iterative regularization approach based on the use of the hinge loss function. More precisely we consider a diagonal approach for a family of algorithms for which we prove convergence as well as rates of convergence. Our approach compares favorably with other alternatives, as confirmed also in numerical simulations.

translated by 谷歌翻译

PIVOT: Prompting for Video Continual Learning

Andrés Villa , Juan León Alcázar , Motasem Alfarra , Kumail Alhamoud , Julio Hurtado , Fabian Caba Heilbron , Alvaro Soto , Bernard Ghanem

分类：计算机视觉 | 人工智能

2022-12-09

Modern machine learning pipelines are limited due to data availability, storage quotas, privacy regulations, and expensive annotation processes. These constraints make it difficult or impossible to maintain a large-scale model trained on growing annotation sets. Continual learning directly approaches this problem, with the ultimate goal of devising methods where a neural network effectively learns relevant patterns for new (unseen) classes without significantly altering its performance on previously learned ones. In this paper, we address the problem of continual learning for video data. We introduce PIVOT, a novel method that leverages the extensive knowledge in pre-trained models from the image domain, thereby reducing the number of trainable parameters and the associated forgetting. Unlike previous methods, ours is the first approach that effectively uses prompting mechanisms for continual learning without any in-domain pre-training. Our experiments show that PIVOT improves state-of-the-art methods by a significant 27% on the 20-task ActivityNet setup.

translated by 谷歌翻译

Cloud-based user modeling for social robots: a first attempt

Marco Botta , Daniele Camilleri , Federica Cena , Francesco Di Sario , Cristina Gena , Giuseppe Ignone , Claudio Mattutino

分类：机器人

2022-09-25

社交机器人是一种自主机器人，通过参与其协作角色附带的社会情感行为，技能，能力和规则，与人们互动。为了实现这些目标，我们认为建模与用户的互动并将机器人行为调整为用户本人对其社会角色至关重要。本文提出了我们首次尝试将用户建模功能集成到社交和情感机器人中。我们提出了一种基于云的体系结构，用于建模用户机器人交互，以便使用不同类型的社交机器人重复使用该方法。

translated by 谷歌翻译

Application of the nnU-Net for automatic segmentation of lung lesion on CT images, and implication on radiomic models

Matteo Ferrante , Lisa Rinaldi , Francesca Botta , Xiaobin Hu , Andreas Dolp , Marta Minotti , Francesca De Piano , Gianluigi Funicelli , Stefania Volpe , Federica Bellerba

分类：计算机视觉

2022-09-24

病变分割是放射线工作流程的关键步骤。手动分割需要长时间的执行时间，并且容易发生可变性，从而损害了放射线研究及其鲁棒性的实现。在这项研究中，对非小细胞肺癌患者的计算机断层扫描图像进行了深入学习的自动分割方法。还评估了手动与自动分割在生存放射模型的性能中的使用。方法总共包括899名NSCLC患者（2个专有：A和B，1个公共数据集：C）。肺部病变的自动分割是通过训练先前开发的建筑NNU-NET进行的，包括2D，3D和级联方法。用骰子系数评估自动分割的质量，以手动轮廓为参考。通过从数据集A的手动和自动轮廓中提取放射性的手工制作和深度学习特征来探索自动分割对患者生存的放射素模型对患者生存的性能的影响。评估并比较模型的精度。结果通过平均2D和3D模型的预测以及应用后处理技术来提取最大连接的组件，可以实现具有骰子= 0.78 +（0.12）的自动和手动轮廓之间的最佳一致性。当使用手动或自动轮廓，手工制作或深度特征时，在生存模型的表现中未观察到统计差异。最好的分类器显示出0.65至0.78之间的精度。结论NNU-NET在自动分割肺部病变中的有希望的作用已得到证实，从而大大降低了时必的医生的工作量，而不会损害基于放射线学的生存预测模型的准确性。

translated by 谷歌翻译

Enhanced Fairness Testing via Generating Effective Initial Individual Discriminatory Instances

Minghua Ma , Zhao Tian , Max Hort , Federica Sarro , Hongyu Zhang , Qingwei Lin , Dongmei Zhang

分类：机器学习

2022-09-17

公平测试旨在减轻数据驱动的AI系统决策过程中的意外歧视。当AI模型为仅根据受保护属性（例如年龄和种族）区分的两个不同的个体做出不同的决定时，可能会发生个人歧视。这样的实例揭示了偏见的AI行为，被称为个人歧视实例（IDI）。在本文中，我们提出了一种选择初始种子以生成IDI进行公平测试的方法。先前的研究主要使用随机的初始种子来实现这一目标。但是，这个阶段至关重要，因为这些种子是后续IDIS生成的基础。我们称我们提出的种子选择方法I＆D。它产生了大量的初始IDI，表现出极大的多样性，旨在提高公平测试的整体性能。我们的实证研究表明，I＆D能够就四种最先进的种子生成方法产生更多的IDI，平均产生1.68倍的IDI。此外，我们比较I＆D在训练机器学习模型中的使用，并发现与最先进的ART相比，使用I＆D将剩余IDI的数量减少了29％，因此表明I＆D有效地改善了模型公平性

translated by 谷歌翻译

Spotting Virus from Satellites: Modeling the Circulation of West Nile Virus Through Graph Neural Networks

Lorenzo Bonicelli , Angelo Porrello , Stefano Vincenzi , Carla Ippoliti , Federica Iapaolo , Annamaria Conte , Simone Calderara

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-07

西尼罗河病毒（WNV）的发生代表了最常见的蚊子传播的人畜共患病毒感染之一。它的循环通常与适合载体增殖和病毒复制的气候和环境条件有关。最重要的是，已经开发了几种统计模型来塑造和预测WNV循环：尤其是，最近的地球观察数据（EO）数据的巨大可用性，再加上人工智能领域的持续发展，提供了宝贵的机会。在本文中，我们试图通过用卫星图像为深度神经网络（DNN）喂食WNV循环，这些图像已被广泛证明可以具有环境和气候特征。值得注意的是，尽管以前的方法可以独立分析每个地理位置，但我们提出了一种空间感知方法，该方法也考虑了近距离位点的特征。具体而言，我们建立在图形神经网络（GNN）的基础上，以从相邻位置进行聚集特征，并进一步扩展这些模块以考虑多个关系，例如两个地点之间的温度和土壤水分差异以及地理距离。此外，我们将与时间相关的信息直接注入模型中，以考虑病毒传播的季节性。我们设计了一个实验环境，将卫星图像（来自Landsat和Sentinel任务）结合在一起，以及意大利WNV循环的地面真相观察。我们表明，与适当的预训练阶段配对时，我们提出的多种jaCencenciencencencence Graph注意网络（MAGAT）始终导致更高的性能。最后，我们在消融研究中评估MAGAT每个组成部分的重要性。

translated by 谷歌翻译

Region-guided CycleGANs for Stain Transfer in Whole Slide Images

Joseph Boyd , Irène Villa , Marie-Christine Mathieu , Eric Deutsch , Nikos Paragios , Maria Vakalopoulou , Stergios Christodoulidis

分类：计算机视觉

2022-08-26

在整个幻灯片成像中，基于苏木精和曙红（H＆E）（H＆E）和免疫组织化学（IHC）的常用染色技术染色了组织景观的不同方面。在检测转移的情况下，IHC提供了一个独特的读数，病理学家很容易解释。但是，IHC是一种更昂贵的方法，在所有医疗中心都不可用。因此，使用深层神经网络从H＆E生成IHC图像成为一种有吸引力的替代方法。诸如Cyclegans之类的深层生成模型学习两个图像域之间的语义一致映射，同时模拟每个域的纹理特性。因此，它们是污渍转移应用程序的合适选择。但是，它们仍然完全无监督，并且没有在染色转移中执行生物学一致性的机制。在本文中，我们提出了以歧视者区域形式向自行车行驶的扩展。这使Cyclegan可以从未配对的数据集中学习，此外，还希望对象有部分注释，希望它能强制执行一致性。我们在整个幻灯片图像上介绍了用例，其中IHC染色为转移细胞提供了实验生成的信号。我们证明了我们的方法优于先前的艺术在两个数据集上对组织病理学瓷砖的污渍转移中的优越性。我们的代码和型号可在https://github.com/jcboyd/miccai2022-Roigan上找到。

translated by 谷歌翻译

Multimodal Emotion Recognition with Modality-Pairwise Unsupervised Contrastive Loss

Riccardo Franceschini , Enrico Fini , Cigdem Beyan , Alessandro Conti , Federica Arrigoni , Elisa Ricci

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-23

情绪识别涉及几个现实世界应用。随着可用方式的增加，对情绪的自动理解正在更准确地进行。多模式情感识别（MER）的成功主要依赖于监督的学习范式。但是，数据注释昂贵，耗时，并且由于情绪表达和感知取决于几个因素（例如，年龄，性别，文化），获得具有高可靠性的标签很难。由这些动机，我们专注于MER的无监督功能学习。我们考虑使用离散的情绪，并用作模式文本，音频和视觉。我们的方法是基于成对方式之间的对比损失，是MER文献中的第一次尝试。与现有的MER方法相比，我们的端到端特征学习方法具有几种差异（和优势）：i）无监督，因此学习缺乏数据标记成本； ii）它不需要数据空间增强，模态对准，大量批量大小或时期； iii）它仅在推理时应用数据融合； iv）它不需要对情绪识别任务进行预训练的骨干。基准数据集上的实验表明，我们的方法优于MER中应用的几种基线方法和无监督的学习方法。特别是，它甚至超过了一些有监督的MER最先进的。

translated by 谷歌翻译

Bia Mitigation for Machine Learning Classifiers: A Comprehensive Survey

Max Hort , Zhenpeng Chen , Jie M. Zhang , Federica Sarro , Mark Harman

分类：机器学习

2022-07-14

本文提供了有关在机器学习（ML）模型中实现公平性的偏置缓解方法的全面调查。我们总共收集了234个有关ML分类器偏置缓解的出版物。这些方法可以根据其干预程序（即预处理，进行内部处理，后处理）及其应用的技术来区分。我们研究了文献中如何评估现有的缓解方法。特别是，我们考虑数据集，指标和基准测试。根据收集的见解（例如，最受欢迎的公平度量是什么？用于评估偏置缓解方法的数据集？）。我们希望在开发和评估新的缓解方法时支持从业者做出明智的选择。

translated by 谷歌翻译