了解皮质回路的信息处理角色是神经科学和人工智能中的一个突出问题。贝叶斯推理的理论设置已被建议作为理解皮质计算的框架。基于最近发表的用于视觉推理的生成模型(George等,2017),我们推导出一系列解剖学实例化和功能性皮层电路模型。与贝叶斯推理的简单模型相反,潜在的生成模型的代表性选择通过需要有效推理和强泛化的现实任务来验证。通过系统地比较该模型的计算要求与已知的解剖学约束来获得皮层电路模型。推导的模型表明在不同的薄层和柱中观察到的前馈,反馈和侧向连接的精确功能作用,并为通过丘脑的路径分配计算作用。
translated by 谷歌翻译
在这项工作中,提出了一个进化艺术项目,其中图像区域通过不同类型的透明,重叠和几何形状(例如,多边形,圆形,线条)进行近似。表示几何形状的特征和顺序的基因型利用适应度函数进化,该适应度函数具有输入图像的相应像素作为目标目标。因此,将基因型 - 表型作图应用于渲染图像,因为选择的遗传表示是间接的,即基因型不包括像素,而是形状与其性质的组合。形状,形状数量,突变类型和种群的不同组合进行了测试。这里的工作目标有两个:(1)用进化的间接编码尽可能精确地近似图像,(2)产生视觉上吸引人的结果和新颖的艺术风格。
translated by 谷歌翻译
对话是交换信息的有效方式,但细微的细节和资金非常重要。虽然重大进展为使用算法进行视觉对话铺平了道路,但细节和细微差别仍然是一个挑战。注意机制已经证明了提取细节隐形问题答案的引人注目的结果,并且由于其可解释性和有效性而为视觉对话提供了令人信服的框架。然而,伴随视觉对话的许多数据都挑战了现有的注意技术。我们解决了这个问题,并开发了visualdialog的一般注意机制,可以在任意数量的数据工具上运行。为此,我们设计了一个基于因子图的注意机制,它结合了任意数量的效用表示。我们说明了所提出的方法对具有挑战性和最近引入的VisDial数据集的适用性,在VisDial0.9中表现优于最近的最新方法1.1%,在VisRial1.0 onMRR上表现优于2%。我们的集合模型将VisDial1.0的MRR得分提高了6%以上。
translated by 谷歌翻译
如今几乎任何给定的任务都可以使用深网动物园,并且越来越不清楚在处理新任务时要从哪个网开始,或者将网用作初始化以微调新模型。为了解决这个问题,在本文中,我们开发了知识流,将“知识”从多个深层网络(称为教师)移动到一个新的深度网络模型,称为学生。教师和学生的结构可以不同,他们可以在不同的输出空间上完成不同任务的训练。在通过知识流程进行培训后,学生将独立于教师。我们展示了我们对各种监督和执行学习任务的方法,超越了微调和其他“知识交换”方法。
translated by 谷歌翻译
协作是执行超出oneagent功能的任务的必要技能。广泛应用于传统和现代AI,多代理协作通常在简单的网格世界中进行研究。我们认为合作存在固有的视觉方面,应该在视觉丰富的环境中进行研究。一个关键的元素合作是通过显式,通过消息或隐式,通过对其他代理和视觉世界的感知来进行的交流。学习在视觉环境中进行协作需要学习(1)执行任务,(2)何时和沟通的内容,以及(3)如何根据这些沟通和视觉世界的感知采取行动。在本文中,我们研究了在AI2-THOR中学习直接从像素协作的问题,并展示了显式和隐式通信模式对于执行视觉任务的好处。有关更多详细信息,请参阅我们的项目页面:https://prior.allenai.org/projects/two-body-problem
translated by 谷歌翻译
机器学习的能力和可访问性不断提高,已经应用于许多真实领域和人员数据。尽管算法系统可能带来的好处,但模型可以反映,注入,表达隐含的和明确的社会偏见到他们的输出中,使某些人口统计子群处于不利地位。由于公平性的大量定义和大量可能受影响的子群,发现机器学习模型所引入的偏差是一个巨大的挑战。我们提出了FairVis,一个混合主动的可视化分析系统,它集成了一种新颖的子组发现技术,供用户审核机器学习模型的公平性。通过FairVis,用户可以应用领域知识来生成和研究已知的子组,并探索建议的和类似的子组.FairVis的协调视图使用户能够探索子组性能的高级概述,并随后深入研究特定子组的详细调查。我们展示了FairVis如何帮助发现用于预测收入和累犯的两个实时数据库中的偏差。作为一个旨在发现机器学习偏差的可视化分析系统,FairVis演示了交互式可视化如何帮助数据科学家和公众理解并创建更公平的算法系统。
translated by 谷歌翻译
远程依赖的表示和学习是机器学习对数据进行排序的现代应用中面临的核心挑战。然而,尽管这个问题突出,但是在给定的数据源中或者在训练有素的深度模型中表示的测量长程依赖性的基本问题仍然主要限于启发式工具。我们根据长记忆随机过程的统计理论,为调查序列建模的当前应用中的长程依赖性做出了统计框架。通过与时间序列文献中的线性前辈类比,我们将递归神经网络(RNN)识别为非线性过程,同时尝试学习输入序列的特征表示和长程依赖结构。我们得出关于真实世界数据中的长记忆与深度网络架构中的学习表示之间的关系的可测试性,其通过适用于高维度设置的半参数框架来探索。我们为simpleestimator建立统计推断的有效性,它产生RNN中长记忆的决策规则。实验表明,该统计框架证实了长记忆存在于各种自然语言和音乐数据中,但表明即使在语言模型中训练基准精度之后,各种RNN架构也未能捕捉到这种属性。
translated by 谷歌翻译
递归神经网络语法(RNNG)是语言的生成模型,其通过以自上而下,从左到右的顺序递增地生成asyntax树和句子来联合地模拟语法和表面结构。受监督的RNNGsachieve强大的语言建模和解析性能,但需要解析的解析树语料库。在这项工作中,我们尝试了无人监督的RNNG学习。由于在潜在树木的空间上直接边缘化是难以处理的,我们改为采用摊销的变分推理。为了最大化证据下限,我们开发了一个推理网络,参数化为自然CRF选区解析器。在语言建模方面,无人监督的RNNG以及英语和汉语基准测试中的监督对应物。关于选区语法归纳,它们与最近的神经语言模型竞争,这些语言模型通过注意机制从单词引导树结构。
translated by 谷歌翻译
我们提出了一个动态四足运动的框架,在挑战中,选择合适的立足点对于行为的成功至关重要。我们使用有效的占用网格表示在线和在线构建环境模型。我们使用Any-time-Repairing A *(ARA *)在树上搜索可能的动作,选择粗糙的身体路径并相应地选择局部最佳的立足点。我们使用动态稳定性指标ZeroMoment Point(ZMP)对身体轨迹进行n步式前瞻优化,生成自然动态的全身运动。浮动基础逆动力学和虚拟模型的组合在一个积极顺应的系统上执行所需的运动。实验试验表明,这个框架允许我们以前一次工作速度的6倍的速度穿越地形,在同一组房间进行评估。
translated by 谷歌翻译
我们提出了一种有腿运动规划方法,用于四足运动过度挑战的地形。我们将问题分解为身体动作计划和足迹计划。我们使用晶格表示和一组定义的身体运动原语来计算身体动作计划。格子表示允许我们计划多种运动,确保每个可能的计划的可行性。为此,我们提出了一组规则来定义脚步搜索区域和给定身体动作的足迹序列。我们使用Anytime Repairing A *(ARA *)搜索来保证有限的次优计划。我们的主要贡献是生成在线多功能运动的计划方法。实验性试验证明了我们在一系列具有挑战性的地形条件下的计划方法。地形信息和计划是在线和在线计算的。
translated by 谷歌翻译