高效全局优化(EGO)广泛用于优化计算上昂贵的黑盒功能。它使用基于高斯过程(克里金法)的替代建模技术。然而,由于使用了静态协方差,克里金不太适合近似非平稳函数。本文探讨了深度高斯过程(DGP)在EGO框架中的整合,以处理非平稳问题,并研究诱发的挑战和机遇。对分析问题进行数值实验以突出DGP和EGO的不同方面。
translated by 谷歌翻译
本文深入研究了影响自我中心凝视的因素。我们不是盲目地为此目的训练深层模型,而是建议在日常任务中检查有助于注视引导的因素。评估底部上升和光流与强空间先验基线的比较。特定任务线索,如消失点,操纵点和手区域,作为自上而下信息的代表进行分析。我们还通过研究以自我为中心的凝视预测的简单的复发神经模型来研究这些因素的贡献。首先,为所有输入视频帧提取深度特征。然后,使用门控循环单元来整合随时间的信息并预测下一次固定。我们还提出了一个综合模型,它将循环模型与几个向下和自底向上的线索相结合。在多个数据集上的广泛实验表明:(1)自我中心视频中的空间偏差很强,(2)自下而上模型在预测凝视和表现不佳空间偏见方面表现不佳,(3)深度特征与传统特征相比表现更好,(4)相反对于手部区域,操纵点是注视预测的强有力影响因素,(5)将提出的复现模型与底部上升,消失点,特别是操纵点相结合,得出最强的注视预测精度超过自我中心视频,(6)知识转移最适用于任务或序列相似的情况,(7)任务和活动识别可以从凝视预测中受益。我们的发现表明:(1)应该更多地强调手 - 物体相互作用;(2)自我中心视觉群体应该考虑更大的数据集,包括多样刺激和更多的主题。
translated by 谷歌翻译
协作是执行超出oneagent功能的任务的必要技能。广泛应用于传统和现代AI,多代理协作通常在简单的网格世界中进行研究。我们认为合作存在固有的视觉方面,应该在视觉丰富的环境中进行研究。一个关键的元素合作是通过显式,通过消息或隐式,通过对其他代理和视觉世界的感知来进行的交流。学习在视觉环境中进行协作需要学习(1)执行任务,(2)何时和沟通的内容,以及(3)如何根据这些沟通和视觉世界的感知采取行动。在本文中,我们研究了在AI2-THOR中学习直接从像素协作的问题,并展示了显式和隐式通信模式对于执行视觉任务的好处。有关更多详细信息,请参阅我们的项目页面:https://prior.allenai.org/projects/two-body-problem
translated by 谷歌翻译
乳糜泻(CD)和环境性肠病(EE)是营养不良的常见原因,并对正常的儿童发育产生不利影响。 CD是一种自身免疫性疾病,在世界范围内普遍存在,并且是由对麸质的敏感性增加引起的。麸质暴露会破坏小肠的上皮屏障,导致营养不良和儿童营养不良。 EE也导致屏障功能障碍,但被认为是由于感染易感性增加所致。 EE被认为是低营养和中等收入国家营养不良,口服疫苗失败和认知发展受损的主要原因。这两种情况都需要进行组织活检以进行诊断,并且是解释临床活检图像以区分这些胃肠疾病之间的主要挑战,这些疾病在它们之间发生组织病理学重叠。在目前的研究中,我们提出了一种卷积神经网络(CNN)来对来自CD,EE和健康对照的受试者的十二指肠活检图像进行分类。我们使用包含1000个活组织检查图像的大型队列评估了我们提出的模型的性能。 Ourevaluations显示,所提出的模型在ROC分别为0.99,1.00,CD,EE和健康对照分别达到0.97。这些结果证明了所提出的模型在十二指肠活检分类中的辨别力。
translated by 谷歌翻译
在本文中,我们试图解决卫星图像中计算构建结构的挑战性问题。与建筑物区域分割相比,建筑密度更准确地估计了人口密度,城市面积扩展及其对环境的影响。然而,建立形状变化,重叠边界和变体密度使这成为一个完整的任务。为了解决这个难题,我们提出了一种基于深度学习的回归技术,用于计算卫星图像中的建筑结构。我们提出的框架使用基于注意力的重新加权技术智能地组合来自卫星图像的不同区域的特征。多并行卷积网络被设计用于捕获不同颗粒的信息。这些功能被组合到FusionNet中,后者用于对不同粒度的特征进行不同的称重,从而可以预测精确的建筑物数量。为了训练和评估所提出的方法,我们提出了一个新的大规模和具有挑战性的建筑结构计数数据集。我们的数据集是通过收集来自不同地理区域(飞机,城市中心,沙漠等)的卫星图像来构建的。全球(亚洲,欧洲,北美和非洲)并且捕获了广泛密集的建筑结构。详细的实验结果和分析验证了所提出的技术。 FusionNet的平均绝对误差为3.65,R平方测量值为测试数据的88%。最后,我们在274:3上进行测试? 103平方米的看不见的地区,在该地区656座建筑物的19栋建筑物的错误。
translated by 谷歌翻译
最近提出了各种偏差校正方法,如EXTRA,DIGing和精确扩散,以解决分布式确定性优化问题。这些方法采用恒定的步长,并在适当的条件下线性收敛到{\ em精确}解。然而,他们的表现低于随机性和适应性设置仍不清楚。如果对自适应网络进行偏差校正仍然是未知的。通过研究精确扩散并在随机情景下检验其稳态性能,本文给出了肯定的结果。结果表明,精确扩散的校正步骤比传统方法具有更好的稳态性能。分析还表明,在连接不良的网络拓扑结构中,精确扩散的优越性更为明显。
translated by 谷歌翻译
我们使用凸分析技术解决了一个投资组合选择问题,该问题结合了主动(优异)和被动(跟踪)目标。我们假设一个一般的半群市场模型,其中资产的增长率过程由潜在因素驱动。使用来自凸分析的技术,我们获得了最优投资组合的封闭形式解决方案,并提供了建立其唯一性的定理。合并因素的动机是实现改进的增长率估计,这是另一项非常困难的任务。为此,我们专注于一个增长率由不可观察的马尔可夫链驱动的模型。在这种情况下的解决方案需要过滤步骤以从资产价格信息获得马尔可夫链状态的后验概率,其随后用于找到最优分配。我们表明,最优策略是投资者在每个州假设马尔科夫链保持在该状态时的最优策略的后验平均值。最后,我们实施了许多历史回溯来证明最佳投资组合的表现。
translated by 谷歌翻译
分析植物根系对于了解不同环境中的植物性能至关重要。虽然磁共振成像(MRI)可以用于获得植物根的3D图像,但是提取根结构模型对于高度嘈杂的土壤环境和低分辨率的MRI图像是具有挑战性的。为了提高对比度和分辨率,我们采用最先进的方法RefineNet,以超分辨率对植物根部MRI图像进行3D分割。网络通过几个手动分割进行训练,这些分割通过几何变换,逼真噪声等进行增强。可变性。结果分割包含大多数根结构,包括由人类注释器提取的分支。
translated by 谷歌翻译
我们引入了动态生成模型,贝叶斯分配模型(BAM),它建立了非负张量因子分解(NTF),离散概率分布的图形模型和它们的贝叶斯扩展之间的显式联系,以及潜在的Dirichlet分配等主题模型。 BAM基于泊松过程,其事件通过使用贝叶斯网络来标记,其中该网络的条件概率表然后被分析地集成。我们证明了最终的边际过程结果是一个Polya urn,一个整数值的自增强过程。这个urn进程,我们命名为Polya-Bayes进程,遵循某些条件独立属性,提供有关NTF特性的进一步见解。这些见解还让我们开发出符合数据潜在稀疏性的节省空间的仿真算法:我们提出了一类用于计算NTF和近似其边际似然的重要抽样算法,这对于模型选择非常有用。结果方法也可以看作主题模型的模型评分方法和隐藏变量的离散贝叶斯网络。与变分算法相比,新算法在稀疏数据体系中具有有利的属性,当观察到的张量的元素的总和变为无穷大时,这些算法变得更加准确。我们在几个例子中说明了性能,并在数值上研究了各种数据体系的算法行为。
translated by 谷歌翻译
以前关于情绪识别的研究表明,结合听觉,视觉和转录文本等几种形式的共同效应可以评估说话者的情感状态。其中,语言形态对评估表达的情绪至关重要。然而,手动转换的口头文本实际上不能作为系统的输入给出。 Weargue认为,在训练和评估阶段使用地面实况转录会导致与真实世界条件相比在性能上存在显着差异,因为语音文本必须在运行中被识别并且可能包含语句识别错误。在本文中,我们提出了一种将自动语音识别(ASR)输出与用于情感识别的字符级重复神经网络相结合的方法。此外,我们进行了多个实验,研究人体机器人相互作用的情绪识别,这是对ASR系统具有挑战性的噪声现实场景。与仅使用声学模态感知识别相比,Wequantify改进。我们通过在二元情绪分类任务中实现73.6%的准确度来证明这种方法在多模态情感语料库(MOSI)中的有效性,超过先前报告的仅使用声学输入的结果。此外,我们在MOSI数据集上设置了一个新的最佳性能(80.4%的准确率,2%的绝对改进)。
translated by 谷歌翻译