智能论文笔记

Uncertainty-Aware Multiple Instance Learning fromLarge-Scale Long Time Series Data

Yuansheng Zhu , Weishi Shi , Deep Shankar Pandey , Yang Liu , Xiaofan Que , Daniel E. Krutz , Qi Yu

分类：人工智能

2021-11-16

我们提出了一种新颖的框架，以便长期分类大型时间序列数据。长时间序号（L-TSC）是一个具有挑战性的问题，因为DATAOFTEN包含大量无关的信息到Checlassification目标。无关期限会降低分类的性能，而系统相关性是未知的。本文提出了一个不确定性，意识到多个型号（MIL）框架，以识别最相关的初期性。预测性的不确定性使得设计指示迫使MIL模型从判别判别期间学习的Anittent机制。此外，预测的不确定性yields是一个原则性的估计器，以识别是否是预测的istrustworthy。我们还通过培训在其可用性上进行单独培训并进行不确定性意识融合表的最终预测来培训另一个模型ToAcModate不可靠的预测。系统评估是进行自动识别系统（AIS）数据，该数据是识别和跟踪现实世界船只的COL。经验结果DemonstriteStriteStepriteStepritisht，该方法可以基于轨迹有效地检测血管的阀门，以及与其他可用数据模块（在我们的实验中使用的合成 - ApertureerAdar或SAR图像）的不确定性令人遗憾地进一步改善检测精度。

translated by 谷歌翻译

Learning Bifunctional Push-grasping Synergistic Strategy for Goal-agnostic and Goal-oriented Tasks

Dafa Ren , Shuang Wu , Xiaofan Wang , Yan Peng , Xiaoqiang Ren

分类：机器人

2022-12-04

Both goal-agnostic and goal-oriented tasks have practical value for robotic grasping: goal-agnostic tasks target all objects in the workspace, while goal-oriented tasks aim at grasping pre-assigned goal objects. However, most current grasping methods are only better at coping with one task. In this work, we propose a bifunctional push-grasping synergistic strategy for goal-agnostic and goal-oriented grasping tasks. Our method integrates pushing along with grasping to pick up all objects or pre-assigned goal objects with high action efficiency depending on the task requirement. We introduce a bifunctional network, which takes in visual observations and outputs dense pixel-wise maps of Q values for pushing and grasping primitive actions, to increase the available samples in the action space. Then we propose a hierarchical reinforcement learning framework to coordinate the two tasks by considering the goal-agnostic task as a combination of multiple goal-oriented tasks. To reduce the training difficulty of the hierarchical framework, we design a two-stage training method to train the two types of tasks separately. We perform pre-training of the model in simulation, and then transfer the learned model to the real world without any additional real-world fine-tuning. Experimental results show that the proposed approach outperforms existing methods in task completion rate and grasp success rate with less motion number. Supplementary material is available at https: //github.com/DafaRen/Learning_Bifunctional_Push-grasping_Synergistic_Strategy_for_Goal-agnostic_and_Goal-oriented_Tasks

translated by 谷歌翻译

LL-GNN: Low Latency Graph Neural Networks on FPGAs for Particle Detectors

Zhiqiang Que , Marcus Loo , Hongxiang Fan , Michaela Blott , Maurizio Pierini , Alexander D Tapper , Wayne Luk

分类：机器学习

2022-09-28

这项工作提出了专门针对粒子探测器的低潜伏期图神经网络（GNN）设计的新型可重构体系结构。加速粒子探测器的GNN是具有挑战性的，因为它需要次微秒延迟才能在CERN大型强子撞机实验的级别1触发器中部署网络以进行在线事件选择。本文提出了一种自定义代码转换，并在基于互动网络的GNN中使用完全连接的图表中的矩阵乘法操作降低了强度，从而避免了昂贵的乘法。它利用了稀疏模式以及二进制邻接矩阵，并避免了不规则的内存访问，从而降低了延迟和硬件效率的提高。此外，我们引入了一种基于外部产品的基质乘法方法，该方法通过降低潜伏期设计的强度降低来增强。此外，引入了融合步骤，以进一步降低设计延迟。此外，提出了GNN特异性算法 - 硬件共同设计方法，该方法不仅找到了具有更好延迟的设计，而且在给定的延迟约束下发现了高精度的设计。最后，已经设计和开源了此低延迟GNN硬件体系结构的可自定义模板，该模板可以使用高级合成工具来生成低延迟的FPGA设计，并有效地利用资源。评估结果表明，我们的FPGA实施速度高24倍，并且消耗的功率比GPU实施少45倍。与我们以前的FPGA实施相比，这项工作的延迟降低了6.51至16.7倍。此外，我们的FPGA设计的延迟足以使GNN在亚微秒，实时撞机触发器系统中部署，从而使其能够从提高的精度中受益。

translated by 谷歌翻译

SCALE: Online Self-Supervised Lifelong Learning without Prior Knowledge

Xiaofan Yu , Yunhui Guo , Sicun Gao , Tajana Rosing

分类：机器学习 | 人工智能

2022-08-24

无监督的终身学习是指随着时间的流逝学习的能力，同时在没有监督的情况下记住以前的模式。以前的作品假设了有关传入数据（例如，了解类边界）的强大先验知识，这些数据是在复杂且不可预测的环境中无法获得的。在本文中，以现实世界情景的启发，我们通过类外的流媒体数据正式定义了在线无监督的终身学习问题，该数据是非IID和单次通道。由于缺乏标签和先验知识，该问题比现有的终身学习问题更具挑战性。为了解决这个问题，我们提出了自我监督的对比终身学习（比例），该学习提取并记住了知识。规模围绕三个主要组成部分进行设计：伪监督的对比损失，自我监督的遗忘损失以及统一子集选择的在线记忆更新。这三个组件旨在协作以最大程度地提高学习表现。我们的损失功能利用成对相似性，因此消除了对监督或先验知识的依赖。我们在IID和四个非IID数据流下进行了全面的规模实验。在所有设置上，缩放量优于最佳最新算法，在CIFAR-10，CIFAR-100和Subimagenet数据集上，提高了高达6.43％，5.23％和5.86％的KNN精度。

translated by 谷歌翻译

Contrastive Semi-supervised Learning for Domain Adaptive Segmentation Across Similar Anatomical Structures

Ran Gu , Jingyang Zhang , Guotai Wang , Wenhui Lei , Tao Song , Xiaofan Zhang , Kang Li , Shaoting Zhang

分类：计算机视觉

2022-08-18

卷积神经网络（CNN）已经实现了医学图像细分的最先进性能，但需要大量的手动注释进行培训。半监督学习（SSL）方法有望减少注释的要求，但是当数据集大小和注释图像的数量较小时，它们的性能仍然受到限制。利用具有类似解剖结构的现有注释数据集来协助培训，这有可能改善模型的性能。然而，由于目标结构的外观不同甚至成像方式，跨解剖结构域的转移进一步挑战。为了解决这个问题，我们提出了跨解剖结构域适应（CS-CADA）的对比度半监督学习，该学习适应一个模型以在目标结构域中细分相似的结构，这仅需要通过利用一组现有现有的现有的目标域中的限制注释源域中相似结构的注释图像。我们使用特定领域的批归归量表（DSBN）来单独地标准化两个解剖域的特征图，并提出跨域对比度学习策略，以鼓励提取域不变特征。它们被整合到一个自我兼容的均值老师（SE-MT）框架中，以利用具有预测一致性约束的未标记的目标域图像。广泛的实验表明，我们的CS-CADA能够解决具有挑战性的跨解剖结构域移位问题，从而在视网膜血管图像和心脏MR图像的帮助下，在X射线图像中准确分割冠状动脉，并借助底底图像，分别仅给定目标域中的少量注释。

translated by 谷歌翻译

Compilation and Optimizations for Efficient Machine Learning on Embedded Systems

Xiaofan Zhang , Yao Chen , Cong Hao , Sitao Huang , Yuhong Li , Deming Chen

分类：机器学习

2022-06-06

深神经网络（DNNS）在各种机器学习（ML）应用程序中取得了巨大成功，在计算机视觉，自然语言处理和虚拟现实等中提供了高质量的推理解决方案。但是，基于DNN的ML应用程序也带来计算和存储要求的增加了很多，对于具有有限的计算/存储资源，紧张的功率预算和较小形式的嵌入式系统而言，这尤其具有挑战性。挑战还来自各种特定应用的要求，包括实时响应，高通量性能和可靠的推理准确性。为了应对这些挑战，我们介绍了一系列有效的设计方法，包括有效的ML模型设计，定制的硬件加速器设计以及硬件/软件共同设计策略，以启用嵌入式系统上有效的ML应用程序。

translated by 谷歌翻译

Est-ce que vous compute? Code-switching, cultural identity, and AI

Arianna Falbo , Travis LaCroix

分类：人工智能 | 自然语言处理

2021-12-15

文化代码切换涉及我们如何调整我们的整体行为，口语方式以及应对我们社会环境的感知变化。我们捍卫需要调查人工智能系统中的文化码切换能力。我们探索了一系列伦理和认识的问题，当培养文化代码切换到人工智能时出现。建立在Dotson的（2014）分析证言窒息的分析，我们讨论了AI中的新兴技术如何产生认识的压迫，具体而言，我们称之为“文化闷闷不乐”的自我沉默形式。通过离开文化代码切换的社会动态特征，通过扩大机遇差距和进一步根深蒂固的社会不平等，AI系统的风险负面影响已经边缘化的社会群体。

translated by 谷歌翻译

Algorithm and Hardware Co-design for Reconfigurable CNN Accelerator

Hongxiang Fan , Martin Ferianc , Zhiqiang Que , He Li , Shuanglong Liu , Xinyu Niu , Wayne Luk

分类：机器学习

2021-11-24

深度神经网络（DNN）的算法 - 硬件共同设计的最新进展已经证明了它们在自动设计神经架构和硬件设计方面的潜力。然而，由于昂贵的培训成本和耗时的硬件实现，这仍然是一个充满挑战的优化问题，这使得对神经结构和硬件设计难以解答的巨大设计空间探索。在本文中，我们证明我们所提出的方法能够在帕累托前沿定位设计。这种功能由新颖的三相协同设计框架启用，具有以下新功能：（a）从硬件架构和神经结构的设计空间探索的DNN培训解耦，（b）提供硬件友好的神经结构空间通过考虑构造搜索单元的硬件特征，（c）采用高斯过程来预测准确性，延迟和功耗以避免耗时的合成和路由过程。与手动设计的Resnet101，Inceptionv2和MobileNetv2相比，我们可以在想象网数据集中获得高达3倍的准确度，高达5％的准确性。与其他最先进的共同设计框架相比，我们发现的网络和硬件配置可以达到更高的2％〜6％，精度为2倍〜26倍，延迟较高8.5倍。

translated by 谷歌翻译

EH-DNAS: End-to-End Hardware-aware Differentiable Neural Architecture Search

Qian Jiang , Xiaofan Zhang , Deming Chen , Minh N. Do , Raymond A. Yeh

分类：机器学习

2021-11-24

在硬件知识可分辨率神经结构中搜索（DNA），计算硬件度量梯度以执行架构搜索是具有挑战性的。现有工作依赖于线性近似，对定制硬件加速器的有限支持。在这项工作中，我们提出了端到端的硬件感知DNA（EH-DNA），无缝集成端到端硬件基准测试，以及全自动DNA，以在各种平台上提供硬件有效的深神经网络，包括边缘GPU，边缘TPU，移动CPU和定制加速器。考虑到期望的硬件平台，我们建议学习一种可分解模型，预测DNA的神经网络架构的端到端硬件性能。我们还介绍了E2E-PERF，用于定制加速器的端到端硬件基准测试工具。 CIFAR10和Imagenet的实验表明，EH-DNA平均提高了硬件性能，平均为您的定制加速器和现有硬件处理器的$ 1.6 \倍$ 1.6 \倍。

translated by 谷歌翻译

One-shot Weakly-Supervised Segmentation in Medical Images

Wenhui Lei , Qi Su , Ran Gu , Na Wang , Xinglong Liu , Guotai Wang , Xiaofan Zhang , Shaoting Zhang

分类：计算机视觉

2021-11-21

深度神经网络通常需要准确和大量注释，以在医学图像分割中实现出色的性能。单次分割和弱监督学习是有前途的研究方向，即通过仅从一个注释图像学习新类并利用粗标签来降低标签努力。以前的作品通常未能利用解剖结构并遭受阶级不平衡和低对比度问题。因此，我们为3D医学图像分割的创新框架提供了一次性和弱监督的设置。首先，提出了一种传播重建网络，以基于不同人体中的解剖模式类似的假设将来自注释体积的划痕投射到未标记的3D图像。然后，双级功能去噪模块旨在基于解剖结构和像素级别来改进涂鸦。在将涂鸦扩展到伪掩码后，我们可以使用嘈杂的标签培训策略培训新课程的分段模型。一个腹部的实验和一个头部和颈部CT数据集显示所提出的方法对最先进的方法获得显着改善，即使在严重的阶级不平衡和低对比度下也能够稳健地执行。

translated by 谷歌翻译