智能论文笔记

Guiding Machine Perception with Psychophysics

Justin Dulay , Sonia Poltoratski , Till S. Hartmann , Samuel E. Anthony , Walter J. Scheirer

分类：计算机视觉 | 机器学习

2022-07-05

{g} {ustav} Fechner 1860年的心理物理学描述，即对其刺激的感觉的测量，被广泛认为是现代心理科学的出现。在心理物理学中，研究人员的参数会改变刺激的某些方面，并衡量人类受试者对该刺激的经历的变化；这样做可以深入了解感觉与唤起它的物理输入之间的关系。这种方法在感知域中大量使用，包括信号检测，阈值测量和理想的观察者分析。像视觉科学这样的科学领域始终依靠心理物理学的方法和程序，但是现在，机器学习研究人员对它们的越来越多，通过在生物学和人工感知之间扩大重叠\ cite \ cite {rojas2011automation {scheireratom，scheirer2014Perceptial2014Perceptual，Escalera2014ChaleAr2014Chalearearearearearnnag，Zhangy2018Agic， grieggs2021measuring}。由行为测量所指导的机器感知，而不是仅限于任意分配人类标签的指导，具有为人工智能进一步进步的巨大潜力。

translated by 谷歌翻译

Financial Risk Management on a Neutral Atom Quantum Processor

Lucas Leclerc , Luis Ortiz-Guitierrez , Sebastian Grijalva , Boris Albrecht , Julia R. K. Cline , Vincent E. Elfving , Adrien Signoles , Loïc Henriet , Gianni Del Bimbo , Usman Ayub Sheikh

分类：机器学习

2022-12-06

Machine Learning models capable of handling the large datasets collected in the financial world can often become black boxes expensive to run. The quantum computing paradigm suggests new optimization techniques, that combined with classical algorithms, may deliver competitive, faster and more interpretable models. In this work we propose a quantum-enhanced machine learning solution for the prediction of credit rating downgrades, also known as fallen-angels forecasting in the financial risk management field. We implement this solution on a neutral atom Quantum Processing Unit with up to 60 qubits on a real-life dataset. We report competitive performances against the state-of-the-art Random Forest benchmark whilst our model achieves better interpretability and comparable training times. We examine how to improve performance in the near-term validating our ideas with Tensor Networks-based numerical simulations.

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Learning Bilinear Models of Actuated Koopman Generators from Partially-Observed Trajectories

Samuel E. Otto , Sebastian Peitz , Clarence W. Rowley

分类：机器学习

2022-09-20

基于近似基础的Koopman操作员或发电机的数据驱动的非线性动力系统模型已被证明是预测，功能学习，状态估计和控制的成功工具。众所周知，用于控制膜系统的Koopman发电机还对输入具有仿射依赖性，从而导致动力学的方便有限维双线性近似。然而，仍然存在两个主要障碍，限制了当前方法的范围，以逼近系统的koopman发电机。首先，现有方法的性能在很大程度上取决于要近似Koopman Generator的基础函数的选择；目前，目前尚无通用方法来为无法衡量保存的系统选择它们。其次，如果我们不观察到完整的状态，我们可能无法访问足够丰富的此类功能来描述动态。这是因为在有驱动时，通常使用时间延迟的可观察物的方法失败。为了解决这些问题，我们将Koopman Generator控制的可观察到的动力学写为双线性隐藏Markov模型，并使用预期最大化（EM）算法确定模型参数。 E-Step涉及标准的Kalman滤波器和更光滑，而M-Step类似于发电机的控制效果模式分解。我们在三个示例上证明了该方法的性能，包括恢复有限的Koopman-Invariant子空间，用于具有缓慢歧管的驱动系统；估计非强制性行驶方程的Koopman本征函数；仅基于提升和阻力的嘈杂观察，对流体弹球系统的模型预测控制。

translated by 谷歌翻译

Model Reduction for Nonlinear Systems by Balanced Truncation of State and Gradient Covariance

Samuel E. Otto , Alberto Padovan , Clarence W. Rowley

分类：机器学习

2022-07-28

数据驱动的降级模型通常无法对沿坐标敏感的高维非线性系统进行准确的预测，因为这种坐标通常经常被截断，例如，通过正确的正交分解，核心成分分析和自动范围。这种系统在剪切主导的流体流中经常遇到，在剪切主导的流体流中，非正常性在障碍的生长中起着重要作用。为了解决这些问题，我们采用来自活跃子空间的想法来查找模型减少的坐标的低维系统，以平衡伴随的信息，以了解该系统的敏感性与沿轨迹的状态方差的敏感性。所得的方法是使用伴随快照（Cobras）称为协方差平衡降低，与平衡截断与状态和基于伴随的梯度协方差矩阵取代了系统gramians并遵守相同的关键转换定律。在这里，提取的坐标与可用于构建彼得罗夫 - 盖尔金还原模型的倾斜投影相关。我们提供了一种有效的基于快照的计算方法，类似于平衡的正交分解。这也导致观察到，可以单独依靠状态和梯度样品的内部产品来计算还原的坐标，从而使我们能够通过用核函数替换内部产品来找到丰富的非线性坐标。在这些坐标中，可以使用回归来学习减少的模型。我们演示了这些技术，并与简单但具有挑战性的三维系统和轴对称喷气流仿真进行比较，并具有$ 10^5 $状态变量。

translated by 谷歌翻译

Applying data technologies to combat AMR: current status, challenges, and opportunities on the way forward

Leonid Chindelevitch , Elita Jauneikaite , Nicole E. Wheeler , Kasim Allel , Bede Yaw Ansiri-Asafoakaa , Wireko A. Awuah , Denis C. Bauer , Stephan Beisken , Kara Fan , Gary Grant

分类：人工智能 | 机器学习

2022-07-05

抗微生物抗性（AMR）是日益增长的公共卫生威胁，估计每年造成超过1000万人死亡，在现状预测下，到2050年，全球经济损失了100万亿美元。这些损失主要是由于治疗失败的发病率和死亡率增加，医疗程序中的AMR感染以及归因于AMR的生活质量损失所致。已经提出了许多干预措施来控制AMR的发展并减轻其传播带来的风险。本文回顾了细菌AMR管理和控制的关键方面，这些方面可以利用人工智能，机器学习以及数学和统计建模等数据技术，这些领域在本世纪已经快速发展。尽管数据技术已成为生物医学研究的组成部分，但它们对AMR管理的影响仍然很小。我们概述了使用数据技术来打击AMR，详细介绍了四个互补类别的最新进展：监视，预防，诊断和治疗。我们在生物医学研究，临床实践和“一个健康”背景下使用数据技术提供了有关当前AMR控制方法的概述。我们讨论了数据技术的潜在影响和挑战在高收入和中等收入国家中面临的实施，并建议将这些技术更容易地整合到医疗保健和公共卫生中所需的具体行动，并建议使用具体的行动部门。

translated by 谷歌翻译

Energy-Efficient Wake-Up Signalling for Machine-Type Devices Based on Traffic-Aware Long-Short Term Memory Prediction

David E. Ruíz-Guirola , Carlos A. Rodríguez-López , Samuel Montejo-Sánchez , Richard Demo Souza , Onel L. A. López , Hirley Alves

分类：机器学习

2022-06-13

减少能源消耗是低功率机型通信（MTC）网络中的一个紧迫问题。在这方面，旨在最大程度地减少机器型设备（MTD）无线电接口所消耗的能量的唤醒信号（WUS）技术是一种有前途的解决方案。但是，最新的WUS机制使用静态操作参数，因此它们无法有效地适应系统动力学。为了克服这一点，我们设计了一个简单但有效的神经网络，以预测MTC流量模式并相应地配置WU。我们提出的预测WUS（FWUS）利用了基于精确的长期记忆（LSTM） - 基于流量预测，该预测允许通过避免在闲置状态下的频繁页面监视场合来延长MTD的睡眠时间。仿真结果显示了我们方法的有效性。流量预测错误显示为4％以下，分别为错误警报和错过检测概率低于8.8％和1.3％。在减少能源消耗方面，FWUS的表现可以胜过高达32％的最佳基准机制。最后，我们证明了FWUS动态适应交通密度变化的能力，促进了低功率MTC可伸缩性

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command Recognition

Wenliang Dai , Samuel Cahyawijaya , Tiezheng Yu , Elham J. Barezi , Peng Xu , Cheuk Tung Shadow Yiu , Rita Frieske , Holy Lovenia , Genta Indra Winata , Qifeng Chen

分类：自然语言处理 | 人工智能

2022-01-11

随着深度学习和智能车辆的兴起，智能助手已成为促进驾驶和提供额外功能的基本内部组件。汽车智能助理应该能够处理一般的和与汽车有关的命令，并执行相应的操作，减轻驾驶和提高安全性。但是，对于低资源语言存在数据稀缺问题，妨碍了研究和应用的发展。在本文中，我们介绍了一个新的DataSet，粤式视听语音识别（CI-AVSR），用于粤语中的车载命令识别，具有视频和音频数据。它由令人宣传的30个粤语发言者记录的200个车载命令的4,984个样本（8.3小时）组成。此外，我们使用常见的内部内部背景噪声增强我们的数据集来模拟真实环境，产生比收集的数据集大10倍。我们提供我们数据集的清洁和增强版本的详细统计信息。此外，我们实施了两个多模式基线以证明CI-AVSR的有效性。实验结果表明，利用视觉信号提高了模型的整体性能。虽然我们的最佳模型可以在清洁测试集上实现相当大的质量，但嘈杂数据的语音识别质量仍然是较差的，并且仍然是真正的车载语音识别系统的极其具有挑战性的任务。数据集和代码将在https://github.com/hltchkust/ci-avsr发布。

translated by 谷歌翻译

Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New Dataset

Tiezheng Yu , Rita Frieske , Peng Xu , Samuel Cahyawijaya , Cheuk Tung Shadow Yiu , Holy Lovenia , Wenliang Dai , Elham J. Barezi , Qifeng Chen , Xiaojuan Ma

分类：自然语言处理

2022-01-07

低资源语言的自动语音识别（ASR）改善了语言少数群体的访问，以便人工智能（AI）提供的技术优势。在本文中，我们通过创建一个新的粤语数据集来解决香港广东语言的数据稀缺问题。我们的数据集多域粤语语料库（MDCC）由73.6小时的清洁阅读语音与成绩单配对，从香港的粤语有声读物收集。它结合了哲学，政治，教育，文化，生活方式和家庭领域，涵盖了广泛的主题。我们还查看所有现有的粤语数据集，并在两个最大的数据集（MDCC和公共语音ZH-HK）上执行实验。我们根据其语音类型，数据源，总大小和可用性分析现有数据集。使用Fairseq S2T变压器，最先进的ASR模型进行实验结果，显示了我们数据集的有效性。此外，我们通过在MDCC和常见的声音ZH-HK上应用多数据集学习来创建一个强大而强大的粤语ASR模型。

translated by 谷歌翻译