智能论文笔记

FAIR-FATE: Fair Federated Learning with Momentum

Teresa Salazar , Miguel Fernandes , Helder Araujo , Pedro Henriques Abreu

分类：机器学习 | 人工智能

2022-09-27

尽管公平感知的机器学习算法一直在受到越来越多的关注，但重点一直放在集中式的机器学习上，而分散的方法却没有被解散。联合学习是机器学习的一种分散形式，客户使用服务器训练本地模型，以汇总它们以获得共享的全局模型。客户之间的数据异质性是联邦学习的共同特征，这可能会诱导或加剧对由种族或性别等敏感属性定义的无私人群体的歧视。在这项工作中，我们提出了公平命运：一种新颖的公平联合学习算法，旨在实现群体公平，同时通过公平意识的聚合方法维持高效用，该方法通过考虑客户的公平性来计算全球模型。为此，通过使用动量术语来估算公平模型更新来计算全局模型更新，该术语有助于克服嘈杂的非直接梯度的振荡。据我们所知，这是机器学习中的第一种方法，旨在使用公平的动力估算来实现公平性。四个现实世界数据集的实验结果表明，在不同级别的数据异质性下，公平命运显着优于最先进的联邦学习算法。

translated by 谷歌翻译

NeMo: 3D Neural Motion Fields from Multiple Video Instances of the Same Action

Kuan-Chieh Wang , Zhenzhen Weng , Maria Xenochristou , Joao Pedro Araujo , Jeffrey Gu , C. Karen Liu , Serena Yeung

分类：计算机视觉

2022-12-28

The task of reconstructing 3D human motion has wideranging applications. The gold standard Motion capture (MoCap) systems are accurate but inaccessible to the general public due to their cost, hardware and space constraints. In contrast, monocular human mesh recovery (HMR) methods are much more accessible than MoCap as they take single-view videos as inputs. Replacing the multi-view Mo- Cap systems with a monocular HMR method would break the current barriers to collecting accurate 3D motion thus making exciting applications like motion analysis and motiondriven animation accessible to the general public. However, performance of existing HMR methods degrade when the video contains challenging and dynamic motion that is not in existing MoCap datasets used for training. This reduces its appeal as dynamic motion is frequently the target in 3D motion recovery in the aforementioned applications. Our study aims to bridge the gap between monocular HMR and multi-view MoCap systems by leveraging information shared across multiple video instances of the same action. We introduce the Neural Motion (NeMo) field. It is optimized to represent the underlying 3D motions across a set of videos of the same action. Empirically, we show that NeMo can recover 3D motion in sports using videos from the Penn Action dataset, where NeMo outperforms existing HMR methods in terms of 2D keypoint detection. To further validate NeMo using 3D metrics, we collected a small MoCap dataset mimicking actions in Penn Action,and show that NeMo achieves better 3D reconstruction compared to various baselines.

translated by 谷歌翻译

Improving debris flow evacuation alerts in Taiwan using machine learning

Yi-Lin Tsai , Jeremy Irvin , Suhas Chundi , João Estacio Gaspar Araujo , Andrew Y. Ng , Christopher B. Field , Peter K. Kitanidis

分类：机器学习 | 人工智能

2022-08-27

台湾对全球碎片流的敏感性和死亡人数最高。台湾现有的碎屑流警告系统，该系统使用降雨量的时间加权度量，当该措施超过预定义的阈值时，会导致警报。但是，该系统会产生许多错误的警报，并错过了实际碎屑流的很大一部分。为了改善该系统，我们实施了五个机器学习模型，以输入历史降雨数据并预测是否会在选定的时间内发生碎屑流。我们发现，随机的森林模型在五个模型中表现最好，并优于台湾现有系统。此外，我们确定了与碎屑流的发生密切相关的降雨轨迹，并探索了缺失碎屑流的风险与频繁的虚假警报之间的权衡。这些结果表明，仅在小时降雨数据中训练的机器学习模型的潜力可以挽救生命，同时减少虚假警报。

translated by 谷歌翻译

Computer vision application for improved product traceability in the granite manufacturing industry

Xurxo Rigueira , Javier Martinez , Maria Araujo , Antonio Recaman

分类：计算机视觉

2022-07-04

花岗岩块的可追溯性包括用代表数值代码的有限数量的颜色带识别每个块。在整个制造过程中，必须多次读取此代码，但其准确性受到人为错误的约束，从而导致可追溯性系统中的故障。提出了计算机视觉系统，以通过颜色检测和相关代码的解密来解决此问题。开发的系统利用了颜色空间转换，以及几个阈值来隔离颜色。实施了计算机视觉方法，以及用于颜色识别的轮廓检测程序。最后，对几何特征的分析用于解密捕获的颜色代码。所提出的算法对在不同的环境条件下拍摄的109张图片进行了训练，并在一组21张图像上进行了验证。结果显示出令人鼓舞的结果，在验证过程中的准确率为75.00％。因此，提出的申请可以帮助员工减少产品跟踪中的错误数量。

translated by 谷歌翻译

It's all About Consistency: A Study on Memory Composition for Replay-Based Methods in Continual Learning

Julio Hurtado , Alain Raymond-Saez , Vladimir Araujo , Vincenzo Lomonaco , Davide Bacciu

分类：机器学习

2022-07-04

持续的学习方法努力减轻灾难性遗忘（CF），在学习新任务时，从以前学习的任务中丢失了知识。在这些算法中，有些在训练时维护以前任务中的样本子集。这些样本称为内存。这些方法表现出出色的性能，同时在概念上简单易于实现。然而，尽管它们很受欢迎，但几乎没有做任何事情来理解要包含在记忆中的元素。当前，这种记忆通常是通过随机抽样填充的，没有指导原则可以有助于保留以前的知识。在这项工作中，我们提出了一个基于称为一致性意识采样（CAWS）的样本的学习一致性的标准。该标准优先考虑通过深网更容易学习的样本。我们对三种不同的基于内存的方法进行研究：AGEM，GDUMB和经验重播，在MNIST，CIFAR-10和CIFAR-100数据集上。我们表明，使用最一致的元素在受到计算预算的约束时会产生性能提高；如果在没有这种约束的情况下，随机抽样是一个强大的基线。但是，在经验重播上使用CAWS可以改善随机基线的性能。最后，我们表明CAWS取得了与流行的内存选择方法相似的结果，同时需要大大减少计算资源。

translated by 谷歌翻译

Sequence-aware multimodal page classification of Brazilian legal documents

Pedro H. Luz de Araujo , Ana Paula G. S. de Almeida , Fabricio A. Braz , Nilton C. da Silva , Flavio de Barros Vidal , Teofilo E. de Campos

分类：自然语言处理

2022-07-02

巴西最高法院每学期收到数万案件。法院员工花费数千个小时来执行这些案件的初步分析和分类 - 这需要努力从案件管理工作流的后部，更复杂的阶段进行努力。在本文中，我们探讨了来自巴西最高法院的文件多模式分类。我们在6,510起诉讼（339,478页）的新型多模式数据集上训练和评估我们的方法，并用手动注释将每个页面分配给六个类之一。每个诉讼都是页面的有序序列，它们既可以作为图像存储，又是通过光学特征识别提取的相应文本。我们首先训练两个单峰分类器：图像上对Imagenet进行了预先训练的重新编织，并且图像上进行了微调，并且具有多个内核尺寸过滤器的卷积网络在文档文本上从SCRATCH进行了训练。我们将它们用作视觉和文本特征的提取器，然后通过我们提出的融合模块组合。我们的融合模块可以通过使用学习的嵌入来处理缺失的文本或视觉输入，以获取缺少数据。此外，我们尝试使用双向长期记忆（BILSTM）网络和线性链条件随机字段进行实验，以模拟页面的顺序性质。多模式方法的表现都优于文本分类器和视觉分类器，尤其是在利用页面的顺序性质时。

translated by 谷歌翻译

Development of a hybrid method for stock trading based on TOPSIS, EMD and ELM

Elivelto Ebermam , Helder Knidel , Renato A. Krohling

分类：神经与进化计算

2022-06-14

决定何时购买或出售股票并不是一件容易的事，因为市场难以预测，受到政治和经济因素的影响。因此，基于计算智能的方法已应用于这个具有挑战性的问题。在这项工作中，每天使用技术分析标准以相似性（TOPSIS）的相似性（TOPSIS）对订单偏好进行排名，并选择最合适的股票进行购买。即便如此，在某些日子甚至Topsis都会选择不正确的选择。为了改善选择，应使用另一种方法。因此，提出了由经验模式分解（EMD）和极端学习机（ELM）组成的混合模型。 EMD将系列分解为几个子系列，因此提取了主要组分（趋势）。该组件由ELM处理，该组件执行下一个组件元素的预测。如果榆树预测的价值大于最后一个值，则确认购买股票的价值。该方法应用于巴西市场的50个股票的宇宙。与随机选择和Bovespa指数产生的回报相比，Topsis进行的选择显示出令人鼓舞的结果。使用EMD-ELM混合动力模型的确认能够增加利润交易的百分比。

translated by 谷歌翻译

Mitigating Bias in Facial Analysis Systems by Incorporating Label Diversity

Camila Kolling , Victor Araujo , Adriano Veloso , Soraia Raupp Musse

分类：计算机视觉 | 人工智能

2022-04-13

面部分析模型越来越多地应用于对人们生活产生重大影响的现实应用中。但是，正如文献所表明的那样，自动对面部属性进行分类的模型可能会对受保护的群体表现出算法歧视行为，从而对个人和社会产生负面影响。因此，开发可以减轻面部分类器中意外偏见的技术至关重要。因此，在这项工作中，我们引入了一种新颖的学习方法，该方法将基于人类的主观标签和基于面部特征的数学定义的客观注释结合在一起。具体而言，我们从两个大规模的人类注销数据集中生成了新的客观注释，每个数据集都捕获了分析的面部特征的不同观点。然后，我们提出了一种合奏学习方法，该方法结合了接受不同类型注释的单个模型。我们对注释过程以及数据集分布提供了深入的分析。此外，我们从经验上证明，通过结合标签多样性，我们的方法成功地减轻了意外偏见，同时保持了下游任务的明显准确性。

translated by 谷歌翻译

Sidewalk Measurements from Satellite Images: Preliminary Findings

Maryam Hosseini , Iago B. Araujo , Hamed Yazdanpanah , Eric K. Tokuda , Fabio Miranda , Claudio T. Silva , Roberto M. Cesar Jr

分类：计算机视觉

2021-12-12

对行人基础设施，特别是人行道的大规模分析对人类以人为本的城市规划和设计至关重要。受益于通过纽约市开放数据门户提供的Procepetric特征和高分辨率OrthoImages的丰富数据集，我们培养计算机视觉模型来检测遥感图像的人行道，道路和建筑物，达到83％的Miou持有-out测试集。我们应用形状分析技术来研究提取的人行道的不同属性。更具体地，我们对人行道的宽度，角度和曲率进行了瓷砖明智的分析，除了它们对城市地区的可行性和可达性的一般影响，众所周知，在轮椅用户的移动性中具有重要作用。初步结果是有前途的，瞥见了不同城市采用的拟议方法的潜力，使研究人员和从业者可以获得更生动的行人领域的画面。

translated by 谷歌翻译

Multiple target tracking with interaction using an MCMC MRF Particle Filter

Helder F. S. Campos , Nuno Paulino

分类：计算机视觉

2021-11-25

本文提出并讨论了多个目标跟踪方法的实现，它能够处理目标交互，防止由于劫持而防止跟踪器失败。参考方法使用Markov链蒙特卡罗（MCMC）采样步骤来评估过滤器并构建有效的提案密度以产生新的样品。该密度基于每个时间步骤生成的Markov随机字段（MRF）集成了目标交互项。 MRFS模拟目标之间的相互作用，以减少典型粒子滤波器在跟踪多个目标时遭受的跟踪模糊性。在受限空间中包含20个相互作用蚂蚁的662灰度帧的测试序列用于测试所提出的方法和基于一个重要的自动粒子过滤器，以建立性能比较。结果表明，使用MRF建模目标交互的实现方法成功地校正了独立，交互不知道粒子过滤器的许多跟踪误差。

translated by 谷歌翻译