智能论文笔记

Understanding the Impact of Adversarial Robustness on Accuracy Disparity

Yuzheng Hu , Fan Wu , Hongyang Zhang , Han Zhao

分类：机器学习 | (统计)机器学习

2022-11-28

While it has long been empirically observed that adversarial robustness may be at odds with standard accuracy and may have further disparate impacts on different classes, it remains an open question to what extent such observations hold and how the class imbalance plays a role within. In this paper, we attempt to understand this question of accuracy disparity by taking a closer look at linear classifiers under a Gaussian mixture model. We decompose the impact of adversarial robustness into two parts: an inherent effect that will degrade the standard accuracy on all classes, and the other caused by the class imbalance ratio, which will increase the accuracy disparity compared to standard training. Furthermore, we also extend our model to the general family of stable distributions. We demonstrate that while the constraint of adversarial robustness consistently degrades the standard accuracy in the balanced class setting, the class imbalance ratio plays a fundamentally different role in accuracy disparity compared to the Gaussian case, due to the heavy tail of the stable distribution. We additionally perform experiments on both synthetic and real-world datasets. The empirical results not only corroborate our theoretical findings, but also suggest that the implications may extend to nonlinear models over real-world datasets.

translated by 谷歌翻译

Honor of Kings Arena: an Environment for Generalization in Competitive Reinforcement Learning

Hua Wei , Jingxiao Chen , Xiyang Ji , Hongyang Qin , Minwen Deng , Siqin Li , Liang Wang , Weinan Zhang , Yong Yu , Lin Liu

分类：机器学习 | 人工智能

2022-09-18

本文介绍了Kings Arena的荣誉，Kings Arena是基于国王荣誉的强化学习（RL）环境，这是世界上最受欢迎的游戏之一。与以前大多数工作中研究的其他环境相比，我们的人对竞争性强化学习提出了新的概括挑战。与对手竞争的一个代理商是一个多代理的问题；它需要概括能力，因为它具有控制和不同的对手竞争的不同目标。我们描述了国王域名荣誉的观察，动作和奖励规范，并提供了一个基于python的开源界面，以与游戏引擎进行通信。我们为纪念国王竞技场的二十个目标英雄提供了各种任务，并为具有可行的计算资源的基于RL的方法提供了初始基线结果。最后，我们展示了国王竞技场的荣誉和对挑战的可能补救措施所面临的概括挑战。所有软件（包括环境级）均可在https://github.com/tencent-ailab/hok_env上公开获得。该文档可在https://aiarena.tencent.com/hok/doc/上获得。

translated by 谷歌翻译

Attention-aware Resource Allocation and QoE Analysis for Metaverse xURLLC Services

Hongyang Du , Jiazhen Liu , Dusit Niyato , Jiawen Kang , Zehui Xiong , Junshan Zhang , Dong In Kim

分类：人工智能

2022-08-10

作为一个与现实世界互动的虚拟世界，元媒体封装了我们对下一代互联网的期望，同时带来了新的关键绩效指标（KPIS）。常规的超级可靠和低延迟通信（URLLC）可以满足绝大多数客观服务KPI，但是很难为用户提供个性化的荟萃服务体验。由于提高经验质量（QOE）可以被视为当务之急的KPI，因此URLLC朝向下一代URLLC（XURLLC），以支持基于图形技术的荟萃分析。通过将更多资源分配给用户更感兴趣的虚拟对象，可以实现更高的QoE。在本文中，我们研究了元服务提供商（MSP）和网络基础架构提供商（INP）之间的相互作用，以部署Metaverse Xurllc服务。提供了最佳合同设计框架。具体而言，将最大化的MSP的实用程序定义为元用户的QOE的函数，同时确保INP的激励措施。为了建模Metaverse Xurllc服务的Qoe，我们提出了一个名为Meta Immersion的新颖指标，该指标既包含了客观网络KPI和元用户的主观感觉。使用用户对象注意级别（UOAL）数据集，我们开发并验证了注意力吸引人的渲染能力分配方案以改善QOE。结果表明，与常规的URLLC相比，Xurllc平均提高了20.1％的QoE改善。当总资源有限时，QoE改进的比例较高，例如40％。

translated by 谷歌翻译

DaisyRec 2.0: Benchmarking Recommendation for Rigorous Evaluation

Zhu Sun , Hui Fang , Jie Yang , Xinghua Qu , Hongyang Liu , Di Yu , Yew-Soon Ong , Jie Zhang

分类：机器学习

2022-06-22

最近，在推荐系统领域中，一个关键问题隐约可见 - 没有进行严格评估的有效基准 - 因此，这会导致不可再生的评估和不公平的比较。因此，我们从实践理论和实验的角度进行研究，目的是为严格的评估做出基准建议。关于理论研究，一系列影响整个评估链中建议性能的超级因素通过对2017 - 2020年在八个顶级会议上发表的141篇论文进行的详尽评价进行了系统的总结和分析。然后，我们将它们分类为独立于模型和模型依赖性的超因子，并相应地定义和讨论了不同的严格评估模式。在实验研究中，我们通过将这些超级因子整合以进行严格的评估来发布DaisyREC 2.0文库，从而进行了整体经验研究，以揭示不同超级效应器对建议性能的影响。在理论和实验研究的支持下，我们最终通过提出标准化程序并在六个数据集上的六个评估指标中提供10个最先进的方法来创建严格评估的基准，以作为以后研究的参考。总体而言，我们的工作阐明了建议评估中的问题，为严格的评估提供了潜在的解决方案，并为进一步调查提供了基础。

translated by 谷歌翻译

Causal Balancing for Domain Generalization

Xinyi Wang , Michael Saxon , Jiachen Li , Hongyang Zhang , Kun Zhang , William Yang Wang

分类：机器学习 | 人工智能 | 计算机视觉

2022-06-10

尽管机器学习模型迅速推进了各种现实世界任务的最先进，但鉴于这些模型对虚假相关性的脆弱性，跨域（OOD）的概括仍然是一个挑战性的问题。尽管当前的域概括方法通常着重于通过新的损耗函数设计在不同域上实施某些不变性属性，但我们提出了一种平衡的迷你批次采样策略，以减少观察到的训练分布中域特异性的虚假相关性。更具体地说，我们提出了一种两步方法，该方法1）识别虚假相关性的来源，以及2）通过在确定的来源上匹配，构建平衡的迷你批次而没有虚假相关性。我们提供了伪造来源的可识别性保证，并表明我们提出的方法是从所有培训环境中平衡，无虚拟分布的样本。实验是在三个具有伪造相关性的计算机视觉数据集上进行的，从经验上证明，与随机的迷你批次采样策略相比，我们平衡的微型批次采样策略可改善四个不同建立的域泛化模型基线的性能。

translated by 谷歌翻译

Building Robust Ensembles via Margin Boosting

Dinghuai Zhang , Hongyang Zhang , Aaron Courville , Yoshua Bengio , Pradeep Ravikumar , Arun Sai Suggala

分类：机器学习 | 人工智能 | (统计)机器学习

2022-06-07

在对抗性鲁棒性的背景下，单个模型通常没有足够的力量来防御所有可能的对抗攻击，因此具有亚最佳的鲁棒性。因此，新兴的工作重点是学习神经网络的合奏，以防止对抗性攻击。在这项工作中，我们采取了一种有原则的方法来建立强大的合奏。我们从增强保证金的角度观察了这个问题，并开发了一种学习最大利润的合奏的算法。通过在基准数据集上进行广泛的经验评估，我们表明我们的算法不仅超过了现有的结合技术，而且还以端到端方式训练的大型模型。我们工作的一个重要副产品是边缘最大化的跨肠损失（MCE）损失，这是标准跨侧面（CE）损失的更好替代方法。从经验上讲，我们表明，用MCE损失取代最先进的对抗训练技术中的CE损失会导致显着提高性能。

translated by 谷歌翻译

Robust Fine-Tuning of Deep Neural Networks with Hessian-based Generalization Guarantees

Haotian Ju , Dongyue Li , Hongyang R. Zhang

分类：机器学习 | 计算机视觉 | (统计)机器学习

2022-06-06

我们考虑采用转移学习方法，可以在目标任务上微调一个预处理的深神经网络。我们研究微调的概括特性，以了解过度拟合的问题，而这种问题通常在实践中发生。先前的工作表明，约束与微调初始化的距离可改善概括。使用Pac-bayesian分析，我们观察到，除了初始化的距离外，黑森人还通过深神网络的噪声稳定性影响噪声注射。在观察过程中，我们为广泛的微调方法开发了基于HESSIAN距离的概括界。此外，我们研究了在嘈杂标签的情况下进行微调的鲁棒性。在我们的理论中，我们设计了一种算法，该算法结合了一致的损失和基于距离的正则化，以进行微调，以及在训练集标签中有条件独立噪声下的概括错误保证。我们对各种嘈杂的环境和体系结构进行了详细的经验研究。在六个图像分类任务上，其训练标签是通过编程标签生成的，我们发现比先前的微调方法的精度增长了3.26％。同时，微型模型的Hessian距离度量降低了六倍，是现有方法的六倍。

translated by 谷歌翻译

Video-driven Neural Physically-based Facial Asset for Production

Longwen Zhang , Chuxiao Zeng , Qixuan Zhang , Hongyang Lin , Ruixiang Cao , Wei Yang , Lan Xu , Jingyi Yu

分类：计算机视觉

2022-02-11

生产级别的工作流程用于产生令人信服的3D动态人体面孔长期以来依赖各种劳动密集型工具用于几何和纹理生成，运动捕获和索具以及表达合成。最近的神经方法可以使单个组件自动化，但是相应的潜在表示不能像常规工具一样为艺术家提供明确的控制。在本文中，我们提出了一种新的基于学习的，视频驱动的方法，用于生成具有高质量基于物理资产的动态面部几何形状。对于数据收集，我们构建了一个混合多视频测量捕获阶段，与超快速摄像机耦合以获得原始的3D面部资产。然后，我们着手使用单独的VAE对面部表达，几何形状和基于物理的纹理进行建模，我们在各个网络的潜在范围内强加了基于全局MLP的表达映射，以保留各个属性的特征。我们还将增量信息建模为基于物理的纹理的皱纹图，从而达到高质量的4K动态纹理。我们展示了我们在高保真表演者特异性面部捕获和跨认同面部运动重新定位中的方法。此外，我们的基于多VAE的神经资产以及快速适应方案也可以部署以处理内部视频。此外，我们通过提供具有较高现实主义的各种有希望的基于身体的编辑结果来激发我们明确的面部解散策略的实用性。综合实验表明，与以前的视频驱动的面部重建和动画方法相比，我们的技术提供了更高的准确性和视觉保真度。

translated by 谷歌翻译

Towards Transferable Unrestricted Adversarial Examples with Minimum Changes

Fangcheng Liu , Chao Zhang , Hongyang Zhang

分类：计算机视觉

2022-01-04

基于转移的对手示例是最重要的黑匣子攻击类别之一。然而，在对抗性扰动的可转移性和难以察觉之间存在权衡。在此方向上的事先工作经常需要固定但大量的$ \ ell_p $ -norm扰动预算，达到良好的转移成功率，导致可察觉的对抗扰动。另一方面，目前的大多数旨在产生语义保留扰动的难以限制的对抗攻击患有对目标模型的可转移性较弱。在这项工作中，我们提出了一个几何形象感知框架，以产生具有最小变化的可转移的对抗性示例。类似于在统计机器学习中的模型选择，我们利用验证模型为$ \ ell _ {\ infty} $ - norm和不受限制的威胁模型中选择每个图像的最佳扰动预算。广泛的实验验证了我们对平衡令人难以置信的难以察觉和可转移性的框架的有效性。方法论是我们进入CVPR'21安全性AI挑战者的基础：对想象成的不受限制的对抗攻击，其中我们将第1位排名第1,559支队伍，并在决赛方面超过了亚军提交的提交4.59％和23.91％分别和平均图像质量水平。代码可在https://github.com/equationliu/ga-attack获得。

translated by 谷歌翻译

Deep Reinforcement Learning for Optimal Power Flow with Renewables Using Spatial-Temporal Graph Information

Jinhao Li , Ruichang Zhang , Hao Wang , Zhi Liu , Hongyang Lai , Yanru Zhang

分类：机器学习 | 人工智能

2021-12-22

可再生能源资源（RERS）已越来越纳入现代电力系统，尤其是在大规模分配网络（DNS）中。在本文中，我们提出了一种深度加强学习（DRL）基础的方法来动态搜索最佳操作点，即最佳功率流（OPF），在具有高摄取RER的DNS中。考虑到由RERS引起的不确定性和电压波动问题，我们将OPF分为多目标优化（MOO）问题。为了解决MOO问题，我们开发了一种利用分发网络图形信息的新型DRL算法。具体而言，我们采用最先进的DRL算法，即深度确定性政策梯度（DDPG），以学习OPF的最佳策略。由于DN中的电力流重新分配是连续的过程，其中节点是在时间和空间视图中自相关和相互关联的，以充分利用DNS的图形信息，我们开发了一种基于多粒的关注的空间 - 时间图卷积用于空间颞曲线图信息提取的网络（MG-ASTGCN），为其顺序DDPG准备。我们在修改IEEE 33,69和118总线径向分布系统（RDS）中验证了基于DRL的基于DRL的方法，并显示了基于DRL的方法优于其他基准算法。我们的实验结果还揭示了MG-ASTGCN可以显着加速DDPG训练过程，并提高DDPG在重新分配OPF电流中的能力。所提出的基于DRL的方法还促进了节点故障存在下的DNS的稳定性，特别是对于大型DNS。

translated by 谷歌翻译