智能论文笔记

The optimality of word lengths. Theoretical foundations and an empirical study

Sonia Petrini , Antoni Casas-i-Muñoz , Jordi Cluet-i-Martinell , Mengxue Wang , Christian Bentz , Ramon Ferrer-i-Cancho

分类：自然语言处理

2022-08-22

人类语言中发现的最强大的模式之一是ZIPF的缩写定律，即更短的单词的趋势。自ZIPF开创性研究以来，该定律被视为压缩的体现，即形式的长度最小化 - 自然交流的普遍原则。尽管对语言进行优化的说法已经变得时尚，但衡量语言优化程度的尝试却相当稀缺。在这里，我们证明压缩在无例外的大量语言中表现出来，并且独立于测量单位。这两个单词长度都可以在书面语言的字符以及口语的持续时间中检测到。此外，为了衡量优化程度，我们得出了一个随机基线的简单公式，并提出了两个分数归一化的分数，即，它们相对于最小值和随机基线都进行了归一化。我们分析了这些和其他分数的理论和统计优势和缺点。利用最佳分数，我们首次量化了语言中单词长度的最佳程度。这表明当单词长度以字符测量时，语言平均被优化至62％或67％（取决于源），当单词长度及时测量时，平均而言，平均而言，平均而言，平均而言，平均而言，平均而言，平均至65％。通常，口语持续时间比字符中的书面单词长度更优化。除了这里报告的分析外，我们的工作还铺平了衡量其他物种发声或手势的最佳程度的方法，并将其与书面，口语或签名的人类语言进行比较。

translated by 谷歌翻译

Pareto Optimization for Active Learning under Out-of-Distribution Data Scenarios

Xueying Zhan , Zeyu Dai , Qingzhong Wang , Qing Li , Haoyi Xiong , Dejing Dou , Antoni B. Chan

分类：机器学习

2022-07-04

基于池的主动学习（AL）通过依次从大型未标记数据池中选择信息的未标记样本并从Oracle/Ontoter中查询标签，从而取得了巨大成功。但是，现有的AL采样策略可能在分布外（OOD）数据方案中无法很好地工作，其中未标记的数据池包含一些不属于目标任务类别的数据示例。在OOD数据情景下实现良好的AL性能是一项具有挑战性的任务，因为Al采样策略与OOD样本检测之间的自然冲突。 Al选择很难由当前基本分类器进行分类的数据（例如，预测类概率具有较高熵的样品），而OOD样品往往具有比分布更均匀的预测类概率（即高熵）（即高熵）（ID ）数据。在本文中，我们提出了一种采样方案，即用于主动学习的蒙特 - 卡洛帕累托优化（POAL），该方案从未标记的数据库中选择了具有固定批次大小的未标记样品的最佳子集。我们将AL采样任务施加为多目标优化问题，因此我们基于两个冲突的目标利用Pareto优化：（1）正常的AL数据采样方案（例如，最大熵）和（2）作为OOD样本。实验结果表明其对经典机器学习（ML）和深度学习（DL）任务的有效性。

translated by 谷歌翻译

LAMP 2.0: A Robust Multi-Robot SLAM System for Operation in Challenging Large-Scale Underground Environments

Yun Chang , Kamak Ebadi , Christopher E. Denniston , Muhammad Fadhil Ginting , Antoni Rosinol , Andrzej Reinke , Matteo Palieri , Jingnan Shi , Arghya Chatterjee , Benjamin Morrell

分类：机器人

2022-05-26

在未知和大规模的地下环境中，与一组异质的移动机器人团队进行搜救，需要高精度的本地化和映射。在复杂和感知衰落的地下环境中，这一至关重要的需求面临许多挑战，因为在船上感知系统需要在非警官条件下运作（由于黑暗和灰尘，坚固而泥泞的地形以及自我的存在以及自我的存在，都需要运作。 - 类似和模棱两可的场景）。在灾难响应方案和缺乏有关环境的先前信息的情况下，机器人必须依靠嘈杂的传感器数据并执行同时定位和映射（SLAM）来构建环境的3D地图，并定位自己和潜在的幸存者。为此，本文报告了Team Costar在DARPA Subterranean Challenge的背景下开发的多机器人大满贯系统。我们通过合并一个可适应不同的探针源和激光镜配置的单机器人前端界面来扩展以前的工作，即LAMP，这是一种可伸缩的多机前端，以支持大型大型和内部旋转循环闭合检测检测规模环境和多机器人团队，以及基于渐变的非凸度的稳健后端，配备了异常弹性姿势图优化。我们提供了有关多机器人前端和后端的详细消融研究，并评估美国跨矿山，发电厂和洞穴收集的挑战现实世界中的整体系统性能。我们还发布了我们的多机器人后端数据集（以及相应的地面真相），可以作为大规模地下大满贯的具有挑战性的基准。

translated by 谷歌翻译

A Comparative Survey of Deep Active Learning

Xueying Zhan , Qingzhong Wang , Kuan-hao Huang , Haoyi Xiong , Dejing Dou , Antoni B. Chan

分类：机器学习

2022-03-25

虽然深度学习（DL）是渴望数据的，并且通常依靠广泛的标记数据来提供良好的性能，但主动学习（AL）通过从未标记的数据中选择一小部分样本进行标签和培训来降低标签成本。因此，近年来，在有限的标签成本/预算下，深入的积极学习（DAL）是可行的解决方案，可在有限的标签成本/预算下最大化模型性能。尽管已经开发了大量的DAL方法并进行了各种文献综述，但在公平比较设置下对DAL方法的性能评估尚未可用。我们的工作打算填补这一空白。在这项工作中，我们通过重新实现19种引用的DAL方法来构建DAL Toolkit，即Deepal+。我们调查和分类与DAL相关的作品，并构建经常使用的数据集和DAL算法的比较实验。此外，我们探讨了影响DAL功效的一些因素（例如，批处理大小，训练过程中的时期数），这些因素为研究人员设计其DAL实验或执行DAL相关应用程序提供了更好的参考。

translated by 谷歌翻译

Improved Fine-tuning by Leveraging Pre-training Data: Theory and Practice

Ziquan Liu , Yi Xu , Yuanhong Xu , Qi Qian , Hao Li , Antoni Chan , Rong Jin

分类：计算机视觉 | 机器学习 | (统计)机器学习

2021-11-24

作为主导范式，微调目标数据的预先训练模型广泛用于许多深度学习应用，特别是对于小数据集。然而，最近的研究已经明确表明，一旦培训迭代的数量增加，划痕训练都没有比这一训练前策略更糟糕的最终表现。在这项工作中，我们从学习理论中流行的泛化分析的角度重新审视这种现象。我们的结果表明，最终预测精度可能具有对预训练模型的弱依赖性，特别是在大训练迭代的情况下。观察激励我们利用预训练预调整的数据，因为此数据也可用于微调。使用预训练数据的泛化结果表明，当适当的预训练数据包含在微调中时，可以提高目标任务的最终性能。随着理论发现的洞察力，我们提出了一种新颖的选择策略来选择从预训练数据中的子集，以帮助改善目标任务的概括。 8个基准数据集上的图像分类任务的广泛实验结果验证了基于数据选择的微调管道的有效性。

translated by 谷歌翻译

Group-based Distinctive Image Captioning with Memory Attention

Jiuniu Wang , Wenjia Xu , Qingzhong Wang , Antoni B. Chan

分类：计算机视觉 | 自然语言处理 | 机器学习

2021-08-20

描述使用自然语言的图像被广泛称为图像标题，这是由于计算机视觉和自然语言生成技术的发展而达成了一致的进展。虽然传统的标题模型基于流行度量的高精度，即BLEU，苹果酒和香料，探索了标题与其他类似图像中的标题的能力。为了产生独特的标题，一些先驱采用对比学习或重新加权地面真理标题，其侧重于一个输入图像。然而，忽略了类似图像组中对象之间的关系（例如，相同专辑中的项目或属性或细粒度事件中的物品）。在本文中，我们使用基于组的独特标题模型（Gdiscap）来提高图像标题的独特性，其将每个图像与一个类似的组中的其他图像进行比较，并突出显示每个图像的唯一性。特别是，我们提出了一种基于组的内存注意力（GMA）模块，其存储在图像组中是唯一的对象特征（即，与其他图像中的对象的低相似性）。生成字幕时突出显示这些唯一的对象功能，从而产生更有独特的标题。此外，选择地面标题中的独特单词来监督语言解码器和GMA。最后，我们提出了一种新的评估度量，独特的单词率（Diswordrate）来测量标题的独特性。定量结果表明，该方法显着提高了几种基线模型的独特性，并实现了精度和独特性的最先进的性能。用户学习的结果与定量评估一致，并证明了新的公制Diswordrate的合理性。

translated by 谷歌翻译

Weight Rescaling: Effective and Robust Regularization for Deep Neural Networks with Batch Normalization

Ziquan Liu , Yufei Cui , Jia Wan , Yu Mao , Antoni B. Chan

分类：机器学习 | (统计)机器学习

2021-02-06

重量衰减通常用于确保具有批归归量的深神经网络的训练实践中的良好概括（BN-DNNS），在该训练中，由于归一化，某些卷积层对于重量重新恢复是不变的。在本文中，我们证明了重量衰减的实际用法仍然存在一些未解决的问题，尽管现有的理论工作在解释BN-DNNS中体重衰减的影响方面。一方面，当非自适应学习率例如使用动量的SGD，即使在初始训练阶段，有效学习率也会继续增加，从而导致许多神经体系结构的过度拟合效果。另一方面，在SGDM和自适应学习率优化器中，例如亚当，体重衰减对概括的影响对超参数非常敏感。因此，找到最佳的重量衰减参数需要广泛的参数搜索。为了解决这些弱点，我们建议使用简单而有效的重量重新缩放（WRS）方案来规范重量规范，以替代体重衰减。 WRS通过将重量标准明确地重新定为单位规范来控制重量规范，从而防止梯度增加，但也确保了足够大的有效学习率以提高概括。在各种计算机视觉应用程序中，包括图像分类，对象检测，语义细分和人群计数，我们与重量衰减，隐含重量重新缩放（重量标准化）和梯度投影（ADAMP）相比，显示了WR的有效性和鲁棒性。

translated by 谷歌翻译

Variational Nested Dropout

Yufei Cui , Yu Mao , Ziquan Liu , Qiao Li , Antoni B. Chan , Xue Liu , Tei-Wei Kuo , Chun Jason Xue

分类：机器学习 | 计算机视觉

2021-01-27

嵌套辍学是辍学操作的变体，能够根据训练期间的预定义重要性订购网络参数或功能。它已被探索：I。构造嵌套网络：嵌套网是神经网络，可以在测试时间（例如基于计算约束）中立即调整架构的架构。嵌套的辍学者隐含地对网络参数进行排名，生成一组子网络，从而使任何较小的子网络构成较大的子网络的基础。 ii。学习排序表示：应用于生成模型的潜在表示（例如自动编码器）对特征进行排名，从而在尺寸上执行密集表示的明确顺序。但是，在整个训练过程中，辍学率是固定为高参数的。对于嵌套网，当删除网络参数时，性能衰减在人类指定的轨迹中而不是从数据中学到的轨迹中。对于生成模型，特征的重要性被指定为恒定向量，从而限制了表示学习的灵活性。为了解决该问题，我们专注于嵌套辍学的概率对应物。我们提出了一个嵌套掉落（VND）操作，该操作以低成本绘制多维有序掩码的样品，为嵌套掉落的参数提供了有用的梯度。基于这种方法，我们设计了一个贝叶斯嵌套的神经网络，以了解参数分布的顺序知识。我们在不同的生成模型下进一步利用VND来学习有序的潜在分布。在实验中，我们表明所提出的方法在分类任务中的准确性，校准和室外检测方面优于嵌套网络。它还在数据生成任务上胜过相关的生成模型。

translated by 谷歌翻译

Improve Generalization and Robustness of Neural Networks via Weight Scale Shifting Invariant Regularizations

Ziquan Liu , Yufei Cui , Antoni B. Chan

分类：机器学习 | (统计)机器学习

2020-08-07

使用重量衰减来惩罚神经网络中的重量规范，这是一种标准的培训实践，可以使网络的复杂性正常。在本文中，我们表明，包括重量衰减在内的一个正规化家族无效地惩罚具有正均匀激活功能的网络的固有权重规范，例如线性，relu和max-pool-pool函数。由于同质性，网络指定的功能是在层之间的重量尺度转移的不变性。无效的正规化器对这种转移敏感，因此使模型容量不正常，导致过度拟合。为了解决这一缺点，我们提出了一个改进的正规器，该正常化程序是体重尺度转移不变的，因此有效地约束了神经网络的内在规范。派生的正常化程序是网络输入梯度的上限，因此最大程度地降低了改进的正规器也使对抗性鲁棒性受益。还考虑了剩余连接，我们表明我们的正规器还形成了这种残留网络的输入梯度的上限。我们证明了我们提出的正常化程序在各种数据集和神经网络体系结构上的功效，以改善概括和对抗性鲁棒性。

translated by 谷歌翻译

Improving concave point detection to better segment overlapped objects in images

Miquel Miró-Nicolau , Biel Moyà-Alcover , Manuel Gonzàlez-Hidalgo , Antoni Jaume-i-Capó

分类：计算机视觉

2020-08-03

本文介绍了一种改进凹点检测方法的最新的方法作为段图像上重叠对象的第一步。它基于对物体轮廓的曲率的分析。该方法有三个主要步骤。首先，我们预处理原始图像以获得每个轮廓点上的曲率的值。其次，我们选择具有更高曲率的区域，我们应用递归算法来改进上一个所选区域。最后，我们基于对每个区域获得凹点，基于对其邻域的相对位置的分析我们通过实验证明了更好的凹点检测意味着更好的集群划分。为了评估凹点检测算法的质量，我们构建了一个合成数据集以模拟重叠对象，从而为凹点作为地面真理提供位置。作为一个案例研究，评估了众所周知的应用的性能，例如镰状细胞贫血患者外周血涂片样品的重叠细胞分裂。我们利用所提出的方法来检测细胞集群中的凹点，然后我们通过椭圆拟合分开该集群。

translated by 谷歌翻译