智能论文笔记

Collaborative Anomaly Detection

Ke Bai , Aonan Zhang , Zhizhong Li , Ricardo Heano , Chong Wang , Lawrence Carin

分类：机器学习

2022-09-20

在推荐系统中，项目可能会接触到各种用户，我们想了解新用户对现有项目的熟悉。这可以作为异常检测（AD）问题进行配置，该问题区分“普通用户”（名义）和“新用户”（异常）。考虑到物品的庞大数量和用户项目配对数据的稀疏性，在每个项目上独立应用传统的单任务检测方法很快就变得困难，而项目之间的相关性则被忽略。为了解决这个多任务异常检测问题，我们建议协作异常检测（CAD）共同学习所有任务，并通过任务之间的嵌入编码相关性来学习所有任务。我们通过条件密度估计和条件可能性比估计来探索CAD。我们发现：$ i $）估计似然比的学习效率更高，并且比密度估计更好。 $ ii $）提前选择少量任务以学习任务嵌入模型，然后使用它来启动所有任务嵌入是有益的。因此，这些嵌入可以捕获任务之间的相关性并推广到新的相关任务。

translated by 谷歌翻译

Improving Downstream Task Performance by Treating Numbers as Entities

Dhanasekar Sundararaman , Vivek Subramanian , Guoyin Wang , Liyan Xu , Lawrence Carin

分类：自然语言处理 | 机器学习

2022-05-07

数字是文本的重要组成部分，就像任何其他单词代币一样，自然语言处理（NLP）模型是构建和部署的。尽管通常在大多数NLP任务中没有明确考虑数字，但NLP模型已经显示出基本数量的算术。在这项工作中，我们尝试利用最先进的NLP模型的潜力，并转移其在相关任务中提高性能的能力。我们建议将数字分类为实体的分类有助于NLP模型在多个任务上表现良好，包括手工制作的填充（FITB）任务以及使用联合嵌入式的问题回答，表现优于Bert和Roberta基线分类。

translated by 谷歌翻译

Capturing Actionable Dynamics with Structured Latent Ordinary Differential Equations

Paidamoyo Chapfuwa , Sherri Rose , Lawrence Carin , Edward Meeds , Ricardo Henao

分类： (统计)机器学习 | 机器学习

2022-02-25

使用黑框模型（例如神经普通微分方程（ODE））对动态系统的端到端学习为从数据中学习动力学的灵活框架提供了一个灵活的框架，而无需为动力学开出数学模型。不幸的是，这种灵活性是基于理解动态系统的成本，而该系统无处不在。此外，在各种条件（输入）（例如处理）或以某种方式分组（例如子人群的一部分）中收集了实验数据。了解这些系统输入对系统输出的影响对于具有动态系统的任何有意义的模型至关重要。为此，我们提出了一个结构化的潜在ode模型，该模型明确捕获了其潜在表示内的系统输入变化。在静态潜在变量规范的基础上，我们的模型学习了（独立的）随机因素，每个输入的系统输入的变异因素，从而将系统输入在潜在空间中的效果分开。该方法通过受控生成的时间序列数据提供了可行的建模，以实现新颖的输入组合（或扰动）。此外，我们提出了一种量化不确定性的灵活方法，利用分位数回归公式。在受到挑战的生物数据集上，在观测数据的受控生成和生物学上有意义的系统输入的推理中，对竞争基准的结果保持一致。

translated by 谷歌翻译

Explainable multiple abnormality classification of chest CT volumes with AxialNet and HiResCAM

Rachel Lea Draelos , Lawrence Carin

分类：计算机视觉 | 机器学习

2021-11-24

了解模型预测在医疗保健方面至关重要，以促进模型正确性的快速验证，并防止利用利用混淆变量的模型。我们介绍了体积医学图像中可解释的多种异常分类的挑战新任务，其中模型必须指示用于预测每个异常的区域。为了解决这项任务，我们提出了一个多实例学习卷积神经网络，AxialNet，允许识别每个异常的顶部切片。接下来我们将赫雷库姆纳入注意机制，识别子切片区域。我们证明，对于Axialnet，Hirescam的说明得到保证，以反映所用模型的位置，与Grad-Cam不同，有时突出不相关的位置。使用一种产生忠实解释的模型，我们旨在通过一种新颖的面具损失来改善模型的学习，利用赫克斯克姆和3D允许的区域来鼓励模型仅预测基于器官的异常，其中出现的异常。 3D允许的区域通过新方法，分区自动获得，其组合从放射学报告中提取的位置信息与通过形态图像处理获得的器官分割图。总体而言，我们提出了第一种模型，用于解释容量医学图像中的可解释的多异常预测，然后使用掩模损耗来实现36,316扫描的Rad-Chessct数据集中多个异常的器官定位提高33％，代表状态本领域。这项工作推进了胸部CT卷中多种异常模型的临床适用性。

translated by 谷歌翻译

Finite-Time Consensus Learning for Decentralized Optimization with Nonlinear Gossiping

Junya Chen , Sijia Wang , Lawrence Carin , Chenyang Tao

分类：机器学习

2021-11-04

分布式学习已成为缩放机器学习并解决数据隐私需求不断增长的积分工具。虽然对网络拓扑的更强大，但分散的学习计划没有获得与其集中式同行相同的人气水平，因为它们具有较低的竞争性能。在这项工作中，我们将此问题归因于分散的学习工人之间缺乏同步，在经验和理论上表现出来，收敛速度与工人之间的同步水平相关联。我们认为，基于非线性漫步（非政府组织）的新型分散式学习框架，享有有吸引力的有限时间共识性，以实现更好的同步。我们对其收敛性提供了仔细分析，并讨论了现代分布式优化应用的优点，如深神经网络。我们对通信延迟和随机聊天如何影响学习的分析进一步实现了适应异步和随机通信的实际变体的推导。为了验证我们提案的有效性，我们通过广泛的测试，我们通过广泛的测试来利用竞争解决方案，令人鼓舞的结果报告。

translated by 谷歌翻译

Variational Inference with Holder Bounds

Junya Chen , Danni Lu , Zidi Xiu , Ke Bai , Lawrence Carin , Chenyang Tao

分类：机器学习 | (统计)机器学习

2021-11-04

最近推出的热集成技术已经了解并改善变推理（VI），提供了一个新的框架。在这项工作中，我们提出了热力学变目标（TVO）的仔细分析，弥合现有的变分目标和脱落的新见解，以推动该领域的差距。特别是，我们阐明了如何将TVO自然连接三个关键变方案，即重要性加权VI，仁义-VI，和MCMC-VI，它包含了最VI目标在实践中采用。为了解释理论和实践之间的性能差距，我们揭示热力学曲线的病理几何形状是如何产生负面影响TVO。通过推广加权平均持有人从几何平均值的整合路径，我们扩展TVO的理论和发现提高VI新的机遇。这促使我们的新VI的目标，命名为持有人的边界，这拼合热力学曲线和承诺，以实现精确的边缘数似然的一步逼近。提供对数字估计的选择的全面讨论。我们目前的合成和真实世界的数据集强有力的实证证据来支持我们的要求。

translated by 谷歌翻译

Supercharging Imbalanced Data Learning With Energy-based Contrastive Representation Transfer

Zidi Xiu , Junya Chen , Ricardo Henao , Benjamin Goldstein , Lawrence Carin , Chenyang Tao

分类：计算机视觉

2020-11-25

处理严重的级别不平衡对现实世界的应用构成了重大挑战，特别是当少数群体课程的准确分类和泛化是主要兴趣时。在计算机视觉中，从长尾数据集学习是一种重复主题，特别是对于自然图像数据集。虽然现有解决方案主要吸引采样或加权调整，以缓解病理不平衡，或强加归纳偏差，以优先考虑非杂散关联，以提高基于因果关系的不耐性原则的示例效率和模型泛化。我们的提议介绍了元分布式场景，其中数据生成机制在标签条件特征分布上不变。即使相应的特征分布表现出明显的差异，这种因果假设能够从主导类到所代价的对应物中的高效知识转移。这使我们能够利用因果关系程序来扩大少数阶级的代表性。我们的开发与现有的极端分类技术正交，因此可以无缝集成。我们提案的效用以广泛的综合性和现实世界计算机视觉任务验证，防止了SOTA解决方案。

translated by 谷歌翻译

Use HiResCAM instead of Grad-CAM for faithful explanations of convolutional neural networks

Rachel Lea Draelos , Lawrence Carin

分类：计算机视觉 | 机器学习

2020-11-17

解释方法有助于开发学习有意义的概念的模型，并避免利用杂散相关性。我们说明了对流行神经网络的先前未被识别的限制解释方法GRAC-CAM：作为梯度平均步骤的副作用，Grad-Cam有时突出显示模型实际使用的位置。为了解决这个问题，我们提出了一种新颖的类特定的解释方法，保证只能突出显示用于制作每个预测的模型的位置。我们证明了亨克斯姆是凸轮的泛化，探索赫什罕与基于梯度的解释方法之间的关系。 Pascal VOC 2012的实验，包括人群源评级，阐述了虽然亨克斯姆的解释忠实地反映了该模型，但Grad-Cam往往会扩大注意力创造更大和更平滑的可视化。总体而言，这项工作进展了卷积神经网络的解释方法，可以帮助开发敏感应用的可靠性模型。

translated by 谷歌翻译

Improving Disentangled Text Representation Learning with Information-Theoretic Guidance

Pengyu Cheng , Martin Renqiang Min , Dinghan Shen , Christopher Malon , Yizhe Zhang , Yitong Li , Lawrence Carin

分类：机器学习 | (统计)机器学习

2020-06-01

学习脱消自然语言的表示对于许多NLP任务至关重要，例如，条件文本生成，样式转移，个性化对话系统等。已经广泛研究了类似的问题，以其他形式的数据，例如图像和视频。然而，自然语言的离散性质使得脱屑更具挑战性（例如，无法轻易实现数据空间的操纵）。受到信息理论的启发，我们提出了一种新的方法，有效地体现了案文的解散表示，没有任何关于语义的监督。派生和利用新的相互信息上限以测量风格和内容之间的依赖。通过最小化该上限，提出的方法将嵌入式和内容嵌入到两个独立的低维空间中。条件文本生成和文本式转移的实验表明了在内容和风格保存方面的高质量。

translated by 谷歌翻译

Urban Visual Intelligence: Studying Cities with AI and Street-level Imagery

Fan Zhanga , Arianna Salazar Mirandaa , Fábio Duarte , Lawrence Vale , Gary Hack , Yu Liu , Michael Batty , Carlo Ratti

分类：计算机视觉

2023-01-02

The visual dimension of cities has been a fundamental subject in urban studies, since the pioneering work of scholars such as Sitte, Lynch, Arnheim, and Jacobs. Several decades later, big data and artificial intelligence (AI) are revolutionizing how people move, sense, and interact with cities. This paper reviews the literature on the appearance and function of cities to illustrate how visual information has been used to understand them. A conceptual framework, Urban Visual Intelligence, is introduced to systematically elaborate on how new image data sources and AI techniques are reshaping the way researchers perceive and measure cities, enabling the study of the physical environment and its interactions with socioeconomic environments at various scales. The paper argues that these new approaches enable researchers to revisit the classic urban theories and themes, and potentially help cities create environments that are more in line with human behaviors and aspirations in the digital age.

translated by 谷歌翻译