人类群体通常能够找到相互合作的方式,不合时宜的,暂时延长的社会困境。基于行为经济学的模型只能解释这种不现实的无状态矩阵游戏的现象。最近,多智能体强化学习被应用于普遍化社会困境问题,以暂时和空间扩展马尔科夫格。然而,这还没有产生一种能够像人类一样学会合作社会困境的代理人。一个关键的洞察力是,许多(但不是全部)人类个体具有不公平的厌恶社会偏好。这促进了矩阵游戏社会困境的特定解决方案,其中不公平 - 反对个人亲自亲社会并惩罚叛逃者。在这里,我们将这一内容扩展到马尔可夫游戏,并表明它通过与政策性能的有利互动促进了几种类型的顺序社会困境中的合作。特别是,我们发现不公平厌恶改善了跨期社会困境的重要类别的时间信用分配。这些结果有助于解释大规模合作可能如何产生和持续存在。
translated by 谷歌翻译
我们介绍Scratchy--一种模块化,轻便的机器人,专为低预算竞争考勤而设计。它的底座主要由标准的4040铝合金轮毂构成,机器人由无刷直流电机上的四个麦克纳姆轮驱动。结合激光测距仪,我们使用估计的测距 - 由编码器计算 - 用于使用粒子滤波器创建地图。 RGB-Dcamera用于物体检测和姿势估计。此外,还可以选择使用6自由度手臂来抓取估计姿势的物体,通常用于操纵任务。机器人可以在不到一个小时的时间内组装成两个手提行李或一个更大的行李箱。因此,它为参加欧洲机器人联盟或RoboCup等机器人比赛的学生团队提供了巨大的优势。因此,这可以保证参与所需的资金,这通常是一个难以克服的障碍,一个很大的障碍。该软件和其他硬件描述可在以下网址获得:https://github.com/homer-robotics/scratchy。
translated by 谷歌翻译
预先训练的语言表示模型在自然语言处理中的各种任务中实现了显着的状态。最重要的进步之一是BERT,这是一种深度预训练的变压器,其产生的结果比其前辈更好。然而,尽管其迅速普及,但BERT尚未应用于文档分类。这项任务值得关注,因为它包含一些细微差别:首先,对于文档分类而言,语法结构的建模不如其他问题,如自然语言推理和情感分类。其次,文档通常在几十个类中有多个标签,这是BERT探索的任务的特征。在本文中,我们描述了用于文档分类的BERT调整BERT。我们是第一个证明BERT在这项任务上取得成功的人,在四个数据集中实现了最先进的技术。
translated by 谷歌翻译
我们提出了一种新的优化工具与学习理论边界的组合,以分析最优核分类器的样本复杂度。这与所有(可能是次优的)分类器的典型学习理论结果形成对比。我们的工作也证明了先前在多核学习方面的工作所做的假设。作为我们分析的副产品,我们还为仅包含最优分类器的假设类提供了一种新形式的Rademacher复杂性。
translated by 谷歌翻译
当前用于建模交互行为的机器人体系结构不适合于对离散动作进行排序和立即合并信息的双重任务。此外,对于基于身体运动的交流,行动还可以作为谈判互动替代方案和实现及时干预的线索。本文提出了一种基于稳定异宿信道网络的动态系统,它提供了一组丰富的参数来不断调制运动,同时保持了一个紧凑的状态图抽象,适用于推理,规划和推理。
translated by 谷歌翻译
我们调查了自DARPA挑战以来开发的自动驾驶汽车文献中发表的关于自动驾驶汽车的研究,这些汽车配备了可归类为SAE 3级或更高等级的自治系统。自动驾驶汽车自治系统的结构通常被组织到感知系统和决策系统中。感知系统通常分为许多子系统,负责执行诸如装配 - 驾驶 - 汽车定位,静态障碍物映射,移动障碍物检测和跟踪,道路测绘,交通信号检测和识别等任务。决策系统通常被划分为许多子系统,负责任务,例如路线规划,路径规划,行为选择,运动规划和控制。在本次调查中,我们展示了自动驾驶汽车自治系统的典型架构。我们还回顾了相关的感知和决策方法的研究。此外,我们还详细描述了UFES汽车自动化系统的架构,IARA 。最后,我们列出了由科技公司开发并在媒体上报道的着名的自主研究汽车。
translated by 谷歌翻译
支持语音的商业产品无处不在,通常通过轻量级设备上的关键字定位(KWS)和云中的全自动语音识别(ASR)来实现。 ASR系统在训练和推理中需要大量的计算资源,更不用说大量的注释语音数据。另一方面,KWS系统的资源密集程度较低,但能力有限。在康卡斯特Xfinity X1娱乐平台上,我们探索了ASR和KWS之间的中间地带:我们引入了一种新颖,资源有效的语音查询识别神经网络,比KWS最先进的CNN更准确,但是可以很容易地训练并使用有限的资源部署。在代表前200个语音查询的评估数据集中,我们实现了1%的低误报率和6%的查询错误率。我们的模型比当前的ASR系统执行推理8.24倍。
translated by 谷歌翻译
目的:确定必要的论证步骤的完整性,以包括当前ML / AI监督学习文献样本中算法的有效性。数据来源:发表在神经信息处理系统(NeurIPS,n \'NIPS)期刊上的论文,官方记录显示2017年的出版物。资格标准:研究报告(半)监督模型,或与表格数据的(半)监督模型融合的预处理。研究评估:三名评价员应用评估标准来确定评价完整性。标准分为三组,包括:实验(例如真实和/或合成数据),基线(例如,信息和/或现有技术)和定量比较(例如具有置信区间的性能量值和算法的正式比较)基准)。结果:在121份符合条件的手稿中(来自679篇摘要的样本),99%使用了真实数据,29%使用了合成数据。 91%的稿件没有报告无知基线,55%报告了最新的基线.32 \%报告了表现的置信区间,但没有提供参考文献说明如何计算这些基线。 3 \%报告正式比较。限制:使用一个期刊作为主要信息来源可能无法代表所有ML / AI文献。然而,NeurIPS会议被认为是有关ML / AI研究的顶级会议,因此将其语料库视为高质量研究的代表是合理的。结论:使用2017年的NeurIPS监督学习语料库样本作为当前ML / AI研究的质量和可信度的指标,似乎在算法效果的示范中完整的论证链是罕见的。
translated by 谷歌翻译
行业规模的推荐系统已成为电子商务购物体验的基石。对于Etsy而言,这是一个拥有超过5000万手工和复古商品的在线市场,用户开始依赖个性化的建议来从其庞大的库存中提取相关产品。 Etsy购物体验的一个标志是用户可以通过多种方式与他们感兴趣的商品进行互动:他们可以查看,喜欢,将其添加到收藏,添加到购物车,购买等等。我们假设不同用户与项目交互的方式表示不同类型的意图。因此,用户的建议不仅应基于其过去活动中的项目,还应基于他们与该项目交互的方式。在本文中,我们提出了一种新的基于交互的项目嵌入方法,该方法不仅对项目本身的交叉模式进行编码,而且还对交互类型进行编码。经过学习的嵌入为我们提供了一种方便的方法,可以通过简单的产品来近似一个项目 - 交互对与另一个项目相互作用的可能性。由于其计算效率,我们的模型自然地作为候选集选择方法,并且我们在Etsy.com上为实时流量提供服务的工业规模推荐系统中对其进行评估。 Ourexperiments揭示了考虑交互类型表明在提高用户购物行为建模的准确性方面有希望的结果。
translated by 谷歌翻译
深度生成模型的最新进展已导致合成高质量图像的显着进步。在成功应用了图像处理和表示学习之后,下一步重要的是探讨视频。学习视频的生成模型是一项更加困难的任务,除了物体的视觉呈现之外,还需要模型来捕捉场景的时间动态。虽然最近制定视频生成模型的尝试取得了一些成功,但目前的进展受到以下因素的影响:(1)缺乏考虑视觉质量,时间一致性和样本多样性的定性指标,以及(2)纯粹合成视频数据集与挑战之间的巨大差距现实世界的数据集就复杂性而言。在这种程度上,我们提出了Fr \'echet视频距离(FVD),一种基于FID的视频生成模型的新计量,以及星际争霸2视频(SCV),这是一组逐步加强的数据集,它们挑战当前迭代生成模型的能力对于视频。我们进行了一项大规模的人体研究,证实了FVD与生成视频的定性人类判断相关,并提供了SCV的初步基准结果。
translated by 谷歌翻译