智能论文笔记

Leveraging Language for Accelerated Learning of Tool Manipulation

Allen Z. Ren , Bharat Govil , Tsung-Yen Yang , Karthik Narasimhan , Anirudha Majumdar

分类：机器人 | 人工智能 | 机器学习

2022-06-27

强大而广义的工具操作需要了解不同工具的属性和提供的功能。我们研究有关工具的语言信息（例如，其几何形状，常用用途）是否可以帮助控制策略更快地适应给定任务的新工具。我们获得了自然语言中各种工具的各种描述，并使用预训练的语言模型来生成其功能表示。然后，我们执行语言条件的元学习，以学习可以有效地适应新工具的政策。我们的结果表明，将语言信息和元学习结合起来可以显着加速工具在几个操纵任务中的学习，包括推动，举重，清扫和锤击。

translated by 谷歌翻译

Personality Detection of Applicants And Employees Using K-mode Algorithm And Ocean Model

Binisha Mohan , Dinju Vattavayalil Joseph , Bharat Plavelil Subhash

分类：人工智能

2022-12-27

The combination of conduct, emotion, motivation, and thinking is referred to as personality. To shortlist candidates more effectively, many organizations rely on personality predictions. The firm can hire or pick the best candidate for the desired job description by grouping applicants based on the necessary personality preferences. A model is created to identify applicants' personality types so that employers may find qualified candidates by examining a person's facial expression, speech intonation, and resume. Additionally, the paper emphasises detecting the changes in employee behaviour. Employee attitudes and behaviour towards each set of questions are being examined and analysed. Here, the K-Modes clustering method is used to predict employee well-being, including job pressure, the working environment, and relationships with peers, utilizing the OCEAN Model and the CNN algorithm in the AVI-AI administrative system. Findings imply that AVIs can be used for efficient candidate screening with an AI decision agent. The study of the specific field is beyond the current explorations and needed to be expanded with deeper models and new configurations that can patch extremely complex operations.

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Exploring Low Rank Training of Deep Neural Networks

Siddhartha Rao Kamalakara , Acyr Locatelli , Bharat Venkitesh , Jimmy Ba , Yarin Gal , Aidan N. Gomez

分类：机器学习 | (统计)机器学习

2022-09-27

培训低级的深层神经网络，即使用分解层，特别是社区感兴趣的：它在记忆消耗和训练时间方面提供了对未分离培训的效率。先前的工作集中在预训练的网络的低级近似值和低级空间中的培训中，并提供了其他目标，为所选实践提供了各种临时解释。我们分析了在实践中运作良好的技术，并通过对诸如GPT2之类的模型进行广泛的消融，我们提供了证据表明该领域的共同信念，这暗示着令人兴奋的研究机会仍然需要回答。

translated by 谷歌翻译

Robust Graph Neural Networks using Weighted Graph Laplacian

Bharat Runwal , Vivek , Sandeep Kumar

分类：机器学习

2022-08-03

图神经网络（GNN）正在在各种应用领域中实现出色的性能。但是，GNN容易受到输入数据中的噪声和对抗性攻击。在噪音和对抗性攻击方面使GNN坚固是一个重要的问题。现有的GNN防御方法在计算上是要求的，并且不可扩展。在本文中，我们提出了一个通用框架，用于鲁棒化的GNN称为加权laplacian GNN（RWL-GNN）。该方法将加权图拉普拉斯学习与GNN实现结合在一起。所提出的方法受益于Laplacian矩阵的积极半定义特性，具有光滑度和潜在特征，通过制定统一的优化框架，从而确保丢弃对抗性/嘈杂的边缘，并适当加权图中的相关连接。为了进行演示，实验是通过图形卷积神经网络（GCNN）体系结构进行的，但是，所提出的框架很容易适合任何现有的GNN体系结构。使用基准数据集的仿真结果建立了所提出方法的疗效，无论是准确性还是计算效率。可以在https://github.com/bharat-runwal/rwl-gnn上访问代码。

translated by 谷歌翻译

TOCH: Spatio-Temporal Object-to-Hand Correspondence for Motion Refinement

Keyang Zhou , Bharat Lal Bhatnagar , Jan Eric Lenssen , Gerard Pons-Moll

分类：计算机视觉

2022-05-16

我们提出了TOCH，这是一种使用数据先验来完善不正确的3D手对象交互序列的方法。现有的手动跟踪器，尤其是那些依靠很少相机的手动跟踪器，通常会通过手动相交或缺失的触点产生视觉上不切实际的结果。尽管纠正此类错误需要有关交互的时间方面的推理，但大多数以前的作品都集中在静态抓取和触点上。我们方法的核心是Toch Fields，这是一种新颖的时空表示，用于在交互过程中建模手和物体之间的对应关系。 Toch字段是一个以对象为中心的表示，它相对于对象编码手的位置。利用这种新颖的表示，我们学习了具有暂时性的自动编码器的合理象征领域的潜在流形。实验表明，Toch优于最先进的3D手动相互作用模型，这些模型仅限于静态抓取和触点。更重要的是，我们的方法甚至在接触之前和之后都会产生平滑的相互作用。使用单个训练有素的TOCH模型，我们定量和定性地证明了其有用性，可用于纠正现成的RGB/RGB/RGB-D手动重建方法，并跨对象传输grasps。

translated by 谷歌翻译

CHORE: Contact, Human and Object REconstruction from a single RGB image

Xianghui Xie , Bharat Lal Bhatnagar , Gerard Pons-Moll

分类：计算机视觉

2022-04-05

大多数先前的作品在从图像中感知3D人类的作品是孤立的，而没有周围的环境。但是，人类一直在与周围的物体互动，因此呼吁不仅可以推理人类，而且可以推理对象及其相互作用的模型。由于人类与物体之间的严重阻塞，不同的相互作用类型和深度歧义，问题极具挑战性。在本文中，我们介绍了一种新颖的方法，该方法学会了从单个RGB图像中共同重建人和物体。乔尔从最近的隐性表面学习和基于经典模型的拟合方面的进步中汲取灵感。我们计算人类和对象的神经重建，该神经用两个无符号距离字段隐式表示，一个对应物的对应字段和一个对象姿势场。这使我们能够在相互作用的推理的同时，可牢固地拟合参数的身体模型和3D对象模板。此外，先前的像素对齐的隐式学习方法使用合成数据并做出实际数据中未满足的假设。我们提出了一个优雅的深度缩放，可以在真实数据上进行更有效的形状学习。实验表明，我们的联合重建通过提出的策略学到了明显优于SOTA。我们的代码和型号可在https://virtualhumans.mpi-inf.mpg.de/chore上找到

translated by 谷歌翻译

Combining Learning from Human Feedback and Knowledge Engineering to Solve Hierarchical Tasks in Minecraft

Vinicius G. Goecks , Nicholas Waytowich , David Watkins , Bharat Prakash

分类：机器学习 | 人工智能

2021-12-07

利益的现实世界任务通常由人类可读描述定义不足，并且没有预定义的奖励信号，除非它由人类设计师定义。相反，数据驱动的算法通常旨在解决特定的，狭义定义的任务，具有驱动代理学习的性能度量。在这项工作中，我们提出了赢得第一名的解决方案，并获得了2021个神经潮端竞赛Minerl Basalt挑战的最人性化的代理：从Minecraft中的人力反馈中学习，该参与者使用人类数据来解决仅限定义的四个任务通过自然语言描述，没有奖励功能。我们的方法使用可用的人类演示数据来培训仿制学习策略，以便导航和额外的人机反馈来训练图像分类器。然后将这些模块与估计的内径型图一起组合到基于人类的人类知识设计的状态机，该任务在自然等级中断和控制学习代理应该在任何瞬间遵循的宏观行为的控制中。我们将这种混合智能方法与端到端机器学习和纯工程解决方案进行比较，然后由人类评估符判断。 CodeBase可在https://github.com/viniciusguigo/kairos_minerl_basalt上获得。

translated by 谷歌翻译

Automatic Goal Generation using Dynamical Distance Learning

Bharat Prakash , Nicholas Waytowich , Tinoosh Mohsenin , Tim Oates

分类：人工智能 | 机器人

2021-11-07

强化学习（RL）代理商可以通过与环境进行交互来学习解决复杂的顺序决策任务。但是，样品效率仍然是一个重大挑战。在多目标RL领域中，需要代理以达到多个目标来解决复杂任务，提高采样效率可能尤其具有挑战性。另一方面，人类或其他生物代理商以更具战略方式学习此类任务，遵循随着难度水平的增加，以便逐步高效的学习进步。在这项工作中，我们提出了一种以自我监督方式使用动态距离功能（DDF）的自动目标生成方法。 DDF是一种函数，它预测马尔可夫决策过程（MDP）内的任何两个状态之间的动态距离。有了这个，我们在适当的难度水平下生成一个目标课程，以便在整个培训过程中有效地学习。我们在几个目标条件的机器人操纵和导航任务中评估这种方法，并在基线方法上显示出样本效率的改进，该方法仅使用随机目标采样。

translated by 谷歌翻译

Automatic ultrasound vessel segmentation with deep spatiotemporal context learning

Baichuan Jiang , Alvin Chen , Shyam Bharat , Mingxin Zheng

分类：人工智能 | 计算机视觉 | 机器学习

2021-11-03

精确，超声图像序列中的血管结构的实时分割可以有助于测量内腔直径和血管疾病的评估。然而，这仍然是一个具有挑战性的任务，特别是对于难以想象的极小船只。我们建议利用超声波利用富时尚背景，以改善小规模下肢动脉脉管系统的分割。我们描述了在多分析尺度的时间，空间和特征感知的上下文嵌入的有效深度学习方法，同时共同利用来自B模式和彩色多普勒信号的信息。评估专家超声波的健康科目的股骨和胫骨动脉扫描，并与内腔边界的共识专家地面说明相比，我们使用上下文感知模型展示了实时分割，并表明它们显着优于相当的基线方法。

translated by 谷歌翻译