智能论文笔记

AirFormer: Predicting Nationwide Air Quality in China with Transformers

Yuxuan Liang , Yutong Xia , Songyu Ke , Yiwei Wang , Qingsong Wen , Junbo Zhang , Yu Zheng , Roger Zimmermann

分类：机器学习

2022-11-29

Air pollution is a crucial issue affecting human health and livelihoods, as well as one of the barriers to economic and social growth. Forecasting air quality has become an increasingly important endeavor with significant social impacts, especially in emerging countries like China. In this paper, we present a novel Transformer architecture termed AirFormer to collectively predict nationwide air quality in China, with an unprecedented fine spatial granularity covering thousands of locations. AirFormer decouples the learning process into two stages -- 1) a bottom-up deterministic stage that contains two new types of self-attention mechanisms to efficiently learn spatio-temporal representations; 2) a top-down stochastic stage with latent variables to capture the intrinsic uncertainty of air quality data. We evaluate AirFormer with 4-year data from 1,085 stations in the Chinese Mainland. Compared to the state-of-the-art model, AirFormer reduces prediction errors by 5%~8% on 72-hour future predictions. Our source code is available at https://github.com/yoshall/airformer.

translated by 谷歌翻译

BrainCog: A Spiking Neural Network based Brain-inspired Cognitive Intelligence Engine for Brain-inspired AI and Brain Simulation

Yi Zeng , Dongcheng Zhao , Feifei Zhao , Guobin Shen , Yiting Dong , Enmeng Lu , Qian Zhang , Yinqian Sun , Qian Liang , Yuxuan Zhao

分类：神经与进化计算

2022-07-18

尖峰神经网络（SNN）引起了脑启发的人工智能和计算神经科学的广泛关注。它们可用于在多个尺度上模拟大脑中的生物信息处理。更重要的是，SNN是适当的抽象水平，可以将大脑和认知的灵感带入人工智能。在本文中，我们介绍了脑启发的认知智力引擎（Braincog），用于创建脑启发的AI和脑模拟模型。 Braincog将不同类型的尖峰神经元模型，学习规则，大脑区域等作为平台提供的重要模块。基于这些易于使用的模块，BrainCog支持各种受脑启发的认知功能，包括感知和学习，决策，知识表示和推理，运动控制和社会认知。这些受脑启发的AI模型已在各种受监督，无监督和强化学习任务上有效验证，并且可以用来使AI模型具有多种受脑启发的认知功能。为了进行大脑模拟，Braincog实现了决策，工作记忆，神经回路的结构模拟以及小鼠大脑，猕猴大脑和人脑的整个大脑结构模拟的功能模拟。一个名为BORN的AI引擎是基于Braincog开发的，它演示了如何将Braincog的组件集成并用于构建AI模型和应用。为了使科学追求解码生物智能的性质并创建AI，Braincog旨在提供必要且易于使用的构件，并提供基础设施支持，以开发基于脑部的尖峰神经网络AI，并模拟认知大脑在多个尺度上。可以在https://github.com/braincog-x上找到Braincog的在线存储库。

translated by 谷歌翻译

Multi-Behavior Hypergraph-Enhanced Transformer for Sequential Recommendation

Yuhao Yang , Chao Huang , Lianghao Xia , Yuxuan Liang , Yanwei Yu , Chenliang Li

分类：人工智能

2022-07-12

对于许多在线平台（例如，视频共享网站，电子商务系统），学习动态用户的偏好已成为越来越重要的组成部分，以提出顺序建议。先前的工作已经做出了许多努力，以基于各种体系结构（例如，经常性的神经网络和自我注意机制）对用户交互序列进行建模项目项目过渡。最近出现的图形神经网络还用作有用的骨干模型，可在顺序推荐方案中捕获项目依赖性。尽管它们有效，但现有的方法却远远集中在具有单一相互作用类型的项目序列表示上，因此仅限于捕获用户和项目之间的动态异质关系结构（例如，页面视图，添加最佳选择，购买，购买）。为了应对这一挑战，我们设计了多行为超毛力增强的变压器框架（MBHT），以捕获短期和长期跨型行为依赖性。具体而言，多尺度变压器配备了低级别的自我注意力，可从细粒度和粗粒水平的共同编码行为感知的顺序模式。此外，我们将全局多行为依赖性纳入HyperGraph神经体系结构中，以自定义的方式捕获层次长期项目相关性。实验结果证明了我们MBHT在不同环境中的各种最新推荐解决方案的优势。进一步的消融研究证明了我们的模型设计和新MBHT框架的好处的有效性。我们的实施代码在以下网址发布：https：//github.com/yuh-yang/mbht-kdd22。

translated by 谷歌翻译

VECtor: A Versatile Event-Centric Benchmark for Multi-Sensor SLAM

Ling Gao , Yuxuan Liang , Jiaqi Yang , Shaoxun Wu , Chenyu Wang , Jiaben Chen , Laurent Kneip

分类：机器人 | 计算机视觉

2022-07-04

事件摄像机最近在高动力或具有挑战性的照明情况下具有强大的常规摄像头的潜力，因此摄影机最近变得越来越受欢迎。通过同时定位和映射（SLAM）给出了可能受益于事件摄像机的重要问题。但是，为了确保在包含事件的多传感器大满贯上进展，需要新颖的基准序列。我们的贡献是使用包含基于事件的立体声摄像机，常规立体声摄像机，多个深度传感器和惯性测量单元的多传感器设置捕获的第一组基准数据集。该设置是完全硬件同步的，并且经过了准确的外部校准。所有序列都均均均均由高度准确的外部参考设备（例如运动捕获系统）捕获的地面真相数据。各个序列都包括小型和大型环境，并涵盖动态视觉传感器针对的特定挑战。

translated by 谷歌翻译

On Private Online Convex Optimization: Optimal Algorithms in $\ell_p$-Geometry and High Dimensional Contextual Bandits

Yuxuan Han , Zhicong Liang , Zhipeng Liang , Yang Wang , Yuan Yao , Jiheng Zhang

分类：机器学习 | (统计)机器学习

2022-06-16

差异化（DP）随机凸优化（SCO）在可信赖的机器学习算法设计中无处不在。本文研究了DP-SCO问题，该问题是从分布中采样并顺序到达的流媒体数据。我们还考虑了连续发布模型，其中与私人信息相关的参数已在每个新数据（通常称为在线算法）上更新和发布。尽管已经开发了许多算法，以实现不同$ \ ell_p $ norm几何的最佳多余风险，但是没有一个现有的算法可以适应流和持续发布设置。为了解决诸如在线凸优化和隐私保护的挑战，我们提出了一种在线弗兰克 - 沃尔夫算法的私人变体，并带有递归梯度，以减少差异，以更新和揭示每个数据上的参数。结合自适应差异隐私分析，我们的在线算法在线性时间中实现了最佳的超额风险，当$ 1 <p \ leq 2 $和最先进的超额风险达到了非私人较低的风险时，当$ 2 <p \ p \ $ 2 <p \ leq \ infty $。我们的算法也可以扩展到$ p = 1 $的情况，以实现几乎与维度无关的多余风险。虽然先前的递归梯度降低结果仅在独立和分布的样本设置中才具有理论保证，但我们在非平稳环境中建立了这样的保证。为了展示我们方法的优点，我们设计了第一个DP算法，用于具有对数遗憾的高维广义线性土匪。使用多种DP-SCO和DP-Bandit算法的比较实验表现出所提出的算法的功效和实用性。

translated by 谷歌翻译

Time-Aware Neighbor Sampling for Temporal Graph Networks

Yiwei Wang , Yujun Cai , Yuxuan Liang , Henghui Ding , Changhu Wang , Bryan Hooi

分类：人工智能

2021-12-18

我们在时间图上提出了一种新的邻居采样方法。在时间图中，预测不同节点的时变特性可能需要各种时间尺度的接收邻域。在这项工作中，我们提出了TNS（时间感知邻居采样）方法：TNS从时间信息学习，以便随时为每个节点提供自适应接收邻域。学习如何样本邻居是非琐碎的，因为邻居指数处于时间顺序是离散的且不可分辨。为了解决这一挑战，我们通过插入邻居的消息，我们将邻居指数从离散值转换为连续的索引。 TNS可以灵活地纳入流行的时间图网络，以提高其有效性，而不会增加时间复杂性。 TNS可以以端到端的方式训练。它不需要额外的监督，并自动和隐含地引导以对预测最有利的邻居进行样本。多个标准数据集的经验结果表明，TNS对边缘预测和节点分类产生了显着的增益。

translated by 谷歌翻译

DualFormer: Local-Global Stratified Transformer for Efficient Video Recognition

Yuxuan Liang , Pan Zhou , Roger Zimmermann , Shuicheng Yan

分类：计算机视觉 | 人工智能

2021-12-09

虽然变形金机对视频识别任务的巨大潜力具有较强的捕获远程依赖性的强大能力，但它们经常遭受通过对视频中大量3D令牌的自我关注操作引起的高计算成本。在本文中，我们提出了一种新的变压器架构，称为双重格式，可以有效且有效地对视频识别进行时空关注。具体而言，我们的Dualformer将完全时空注意力分层到双级级联级别，即首先在附近的3D令牌之间学习细粒度的本地时空交互，然后捕获查询令牌之间的粗粒度全局依赖关系。粗粒度全球金字塔背景。不同于在本地窗口内应用时空分解或限制关注计算以提高效率的现有方法，我们本地 - 全球分层策略可以很好地捕获短期和远程时空依赖项，同时大大减少了钥匙和值的数量在注意计算提高效率。实验结果表明，对抗现有方法的五个视频基准的经济优势。特别是，Dualformer在动态-400/600上设置了新的最先进的82.9％/ 85.2％，大约1000g推理拖鞋，比具有相似性能的现有方法至少3.2倍。

translated by 谷歌翻译

Periodic Residual Learning for Crowd Flow Forecasting

Chengxin Wang , Yuxuan Liang , Gary Tan

分类：机器学习 | 人工智能 | 计算机视觉

2021-12-08

旨在预测人群进入或离开某些地区的人群的预测是智能城市的一项基本任务。人群流数据的关键属性之一是周期性：一种按常规时间间隔发生的模式，例如每周模式。为了捕获这种周期性，现有研究要么将周期性的隐藏状态融合到网络中，以学习或将额外的定期策略应用于网络体系结构。在本文中，我们设计了一个新颖的定期残差学习网络（PRNET），以更好地建模人群流数据中的周期性。与现有方法不同，PRNET通过建模输入（上一个时期）和输出（未来时间段）之间的变化来将人群流动预测作为周期性的残差学习问题。与直接预测高度动态的人群流动相比，学习更多的固定偏差要容易得多，从而有助于模型训练。此外，学到的变化使网络能够在每个时间间隔内产生未来条件及其相应每周观察的残差，因此有助于更准确的多步骤预测。广泛的实验表明，PRNET可以轻松地集成到现有模型中，以增强其预测性能。

translated by 谷歌翻译

Structure-Aware Label Smoothing for Graph Neural Networks

Yiwei Wang , Yujun Cai , Yuxuan Liang , Wei Wang , Henghui Ding , Muhao Chen , Jing Tang , Bryan Hooi

分类：机器学习 | 人工智能

2021-12-01

表示标签分布作为一个热量矢量是培训节点分类模型中的常见做法。然而，单热表示可能无法充分反映不同类别中节点的语义特征，因为某些节点可以在其他类中的邻居语义上靠近其邻居。由于鼓励在对每个节点进行分类时，鼓励模型分配完全概率，因此会导致过度自信。虽然具有标签平滑的培训模型可以在某种程度上缓解此问题，但它仍然无法捕获图形结构隐含的节点的语义特征。在这项工作中，我们提出了一种新颖的SAL（\ Textit {Security-Aware标签平滑}）方法作为流行节点分类模型的增强组件。 SAL利用图形结构来捕获连接节点之间的语义相关性并生成结构感知标签分配以替换原始的单热标签向量，从而改善节点分类性能而不推广成本。七节点分类基准数据集的广泛实验揭示了我们对改进转膜和归纳节点分类的含量的有效性。经验结果表明，SALS优于标签平滑方法，增强节点分类模型以优于基线方法。

translated by 谷歌翻译

Phase function estimation from a diffuse optical image via deep learning

Yuxuan Liang , Chuang Niu , Chen Wei , Shenghan Ren , Wenxiang Cong , Ge Wang

分类：机器学习

2021-11-16

相位函数是Monte Carlo（MC）仿真的光传播模型的关键元件，其通常配备有具有相关参数的分析功能。据报道，据报道，机器学习方法估计特定形式的相位函数的参数，例如Henyey-Greenstein相位功能，但是，对于我们的知识，没有进行研究以确定相位功能的形式。在这里，我们设计卷积神经网络，以估计来自漫反射光图像的相位函数而没有对相位函数的形式进行任何明确的假设。具体地，我们使用高斯混合模型作为示例来表示相位函数，并准确地学习模型参数。选择高斯混合模型，因为它提供了相位函数的分析表达，以便于MC模拟中促进偏转角采样，并且不会显着增加自由参数的数量。我们所提出的方法在典型的生物组织的MC模拟反射图像上使用不同的各向异性因子进行典型生物组织的MC模拟反射图像。分析了视野（FOV）和空间分辨率对误差的影响以优化估计方法。相位函数的平均平方误差为0.01，各向异性因子的相对误差为3.28％。

translated by 谷歌翻译