Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.
translated by 谷歌翻译
最近的研究表明,看似公平的机器学习模型在为对人们的生活或福祉产生影响的决策提供信息(例如,涉及教育,就业和贷款的申请)可能会在长期内无意中增加社会不平等。这是因为先前的公平意识算法仅考虑静态公平限制,例如机会均等或人口统计奇偶。但是,强制执行这种类型的限制可能会导致模型对处境不利的个人和社区产生负面影响。我们介绍ELF(执行长期公平性),这是第一个分类算法,可提供高信任公平保证,以长期或延迟影响。我们证明,ELF返回不公平解决方案的概率小于用户指定的公差,并且(在轻度假设下),如果有足够的培训数据,ELF能够找到并返回公平的解决方案,如果存在一个公平的解决方案。我们通过实验表明,我们的算法可以成功缓解长期不公平。
translated by 谷歌翻译
为了在工业生产中更广泛地采用AI,足够的基础设施能力至关重要。这包括简化AI与工业设备的集成,对分布式部署,监视和一致的系统配置的支持。现有的IIOT平台仍然缺乏以开放的,基于生态系统的方式灵活整合可重复使用的AI服务和相关标准(例如资产管理壳或OPC UA)的功能。这正是我们采用高度可配置的基于低代码的方法来解决我们下一个级别的智能工业生产生产生产Ecosphere(IIP-Ecosphere)平台所解决的问题。在本文中,我们介绍了该平台的设计,并根据启用AI支持的视觉质量检查的演示者讨论了早期评估。在这项早期评估活动中,学到的见解和教训补充了这一点。
translated by 谷歌翻译
在核医学中,规定放射性碘治疗以治疗甲状腺功能亢进等疾病。规定剂量的计算在甲状腺体积上取决于其他因素。目前使用传统的2D超声成像估计这一点。但是,这种模态本质上是依赖的,导致体积估计的高变异性。为了提高再现性和一致性,我们用甲状腺体积的自动机器人超声扫描唯一地结合了基于神经网络的分割。通过使用具有连接超声探头的6 DOF机器人臂实现机器人采集。其运动基于每个甲状腺叶的在线分割和美国图像的外观。在后处理期间,将美国图像分段以获得体积估计。在一种消融研究中,与机器人在体积精度方面执行的与机器人执行的天真线性运动相比,我们证明了机器人臂运动的运动引导算法的优越性。在对幻影的用户研究中,我们将传统的2D超声测量与机器人系统进行了比较。与地面真理相比,超声专家用户的平均体积测量误差可能会从20.85 +/- 16.10%显着降低到仅8.23 +/- 3.10%。在非专家用户中观察到这种趋势,其中测量了与机器人系统的平均误差改善,以高达85美元的价格,这显然显示了机器人支持的优势。
translated by 谷歌翻译
面部美容预测(FBP)旨在开发一种机器,自动制作面部吸引力评估。在过去的情况下,结果与人类评分高度相关,因此也与注释的偏差相同。由于人工智能可以具有种族主义和歧视性倾向,必须识别数据中偏差的原因。培训数据的开发和对抗偏见信息具有强大的算法是科学家的新挑战。随着审美判断通常偏见,我们希望进一步迈出一步,并为FBP提出一个非偏见的卷积神经网络。虽然可以从道德角度创建可以对脸部的吸引力的网络模型,从道德的角度来看,它同样重要的是要确保模型是无偏的。在这项工作中,我们引入了美学,最先进的吸引力预测网络,这显着优于竞争对手0.9601的Pearson相关性。此外,我们提出了一种新的方法,用于产生无偏见的CNN,以改善机器学习中的公平性。
translated by 谷歌翻译
基于惯性传感器的姿态估计是各种应用中的重要技术,来自人类运动跟踪到自主空中和地面车辆。应用场景在执行运动的特征,扰动和环境条件的存在方面不同。由于最先进的态度估计器不概括在这些特征上,因此必须对其参数进行调整以用于各个运动特性和情况。我们提出了RIANN,即立即使用,基于神经网络,无参数,实时功能的惯性态度估计器,其横跨不同的运动动态,环境和采样率概括,而无需特定于应用程序适应。我们收集六个公开的数据集,其中我们利用了两个数据集进行了方法开发和培训,并使用四个数据集进行三种不同的测试场景评估培训的估计,不同的实际相关性。结果表明,RIANN优于最先进的态度估算过滤器,以至于它在不同应用中的各种动作和条件上遍历了更好的方式,具有不同的传感器硬件和不同的采样频率。即使在每个单独的测试数据集上调整过滤器,也是如此,而RANN在完全分开的数据上培训,并且从未见过任何这些测试数据集。 RIANN可以直接应用,没有适应或培训,预计将在许多应用中启用即插即用解决方案,特别是当准确性至关重要时,没有地理数据可以调整或运动和扰动特性不确定。我们宣传了Riann。
translated by 谷歌翻译
随着空间的尺寸增加,在真实数据中分类高维形状的问题在复杂性中增长。对于识别不同几何形状的凸形形状的情况,最近提出了一种新的分类框架,其中使用一种称为射线的一组一维表示的交叉点,其中具有形状的边界来识别特定几何形状。基于射线的分类(RBC)已经使用两维和三维形状的合成数据集进行了经验验证的(Zwolak等人。在第三讲习班关于机器学习和物理科学(Neurips 2020),温哥华,加拿大的第三次研讨会的程序中[ arxiv:2010年12月11日,2010年12月11日,最近也已经通过实验验证(Zwolak等,Prx量子2:020335,2021)。在这里,我们建立了由关键角度度量定义的形状分类所需的光线数量的绑定,用于任意凸形形状。对于两个维度,我们在形状的长度,直径和外部角度方面导出了射线数量的下限。对于$ \ mathbb {r} ^ n $的凸多台,我们将此结果概括为与二向角度的函数和多边形面的几何参数给出的类似绑定。该结果使得能够使用比体积或基于表面的方法基本更少的数据元素估计高维形状的不同方法。
translated by 谷歌翻译
在本文中,我们介绍了四种突出的恶意软件检测工具的科学评估,以帮助组织提出两个主要问题:基于ML的工具在多大程度上对以前和从未见过的文件进行了准确的分类?是否值得购买网络级恶意软件检测器?为了识别弱点,我们针对各种文件类型的总计3,536个文件(2,554或72 \%恶意,982或28 \%良性)测试了每个工具,包括数百个恶意零日,polyglots和apt-style-style style文件,在多个协议上交付。我们介绍了有关检测时间和准确性的统计结果,请考虑互补分析(一起使用多个工具),并提供了近期成本效益评估程序的两种新颖应用。尽管基于ML的工具在检测零日文件和可执行文件方面更有效,但基于签名的工具仍然是总体上更好的选择。两种基于网络的工具都与任何一种主机工具配对时都可以进行大量(模拟)节省,但两者在HTTP或SMTP以外的协议上都显示出较差的检测率。我们的结果表明,所有四个工具都具有几乎完美的精度但令人震惊的召回率,尤其是在可执行文件和Office文件以外的文件类型上 - 未检测到37%的恶意软件,包括所有Polyglot文件。给出了研究人员的优先事项,并给出了最终用户的外卖。
translated by 谷歌翻译
强化学习中的信用作业是衡量行动对未来奖励的影响的问题。特别是,这需要从运气中分离技能,即解除外部因素和随后的行动对奖励行动的影响。为实现这一目标,我们将来自因果关系的反事件的概念调整为无模型RL设置。关键思想是通过学习从轨迹中提取相关信息来应对未来事件的价值函数。我们制定了一系列政策梯度算法,这些算法使用这些未来条件的价值函数作为基准或批评,并表明它们是可怕的差异。为避免对未来信息的调理潜在偏见,我们将后视信息限制为不包含有关代理程序行为的信息。我们展示了我们对许多说明性和具有挑战性问题的算法的功效和有效性。
translated by 谷歌翻译
Pennylane是用于量子计算机可区分编程的Python 3软件框架。该库为近期量子计算设备提供了统一的体系结构,支持量子和连续变化的范例。 Pennylane的核心特征是能够以与经典技术(例如反向传播)兼容的方式来计算变异量子电路的梯度。因此,Pennylane扩展了在优化和机器学习中常见的自动分化算法,以包括量子和混合计算。插件系统使该框架与任何基于门的量子模拟器或硬件兼容。我们为硬件提供商提供插件,包括Xanadu Cloud,Amazon Braket和IBM Quantum,允许Pennylane优化在公开访问的量子设备上运行。在古典方面,Pennylane与加速的机器学习库(例如Tensorflow,Pytorch,Jax和Autograd)接口。 Pennylane可用于优化变分的量子本素体,量子近似优化,量子机学习模型和许多其他应用。
translated by 谷歌翻译