本文介绍了一种用于开发面向控制的建筑物的散热模型的数据驱动建模方法。这些型号是通过降低能耗成本的目标而开发的,同时控制建筑物的室内温度,在所需的舒适度限制内。结合白/灰盒物理模型的可解释性和神经网络的表现力,我们提出了一种物理知识的神经网络方法,用于这种建模任务。除了测量的数据和构建参数之外,我们将通过管理这些建筑物的热行为的底层物理编码神经网络。因此,实现了由物理学引导的模型,有助于建模室温和功耗的时间演化以及隐藏状态,即建筑物热质量的温度。这项工作的主要研究贡献是:(1)我们提出了两种物理学的变种信息,为机构的控制定向热建模任务提供了通知的神经网络架构,(2)我们展示这些架构是数据效率的,需要更少培训数据与传统的非物理知识的神经网络相比,(3)我们表明这些架构比传统的神经网络实现更准确的预测,用于更长的预测视野。我们使用模拟和实际字数据测试所提出的架构的预测性能,以演示(2)和(3),并显示所提出的物理知识的神经网络架构可以用于该控制导向的建模问题。
translated by 谷歌翻译
意义表示(AMR)是一种基于图形的语义表示的句子,由语义关系链接的概念集合组成。基于AMR的方法在各种应用程序中找到了成功,但在需要文档级背景下的任务中使用它的挑战是它只代表单个句子。在基于AMR的总结中的事先工作已经自动将单个句子图与文档图合并到文档图中,但尚未独立地评估合并方法及其对摘要内容选择的影响。在本文中,我们介绍了一种新的数据集,由配对文件的节点与可用于评估(1)合并策略之间的摘要之间的人为注释对齐组成; (2)在合并或未混合的AMR图表的节点上的内容选择方法的性能。我们将这两种形式的评估应用于现有工作以及节点合并的新方法,并表明我们的新方法比现有工作明显更好。
translated by 谷歌翻译
培训文本到图像生成模型中的主要挑战之一是需要大量的高质量图像文本对。虽然图像样本通常很容易接近,但相关的文本描述通常需要仔细的人类标题,这是特别的 - 耗时和成本耗费。在本文中,我们提出了第一项工作来培训没有任何文本数据的文本到图像生成模型。我们的方法利用了强大的预训练剪辑模型的良好对齐的多模态语义空间:通过从图像特征生成文本特征,无缝地减轻了文本调节的要求。进行广泛的实验以说明所提出的方法的有效性。我们在标准的文本到图像生成任务中获得最先进的结果。重要的是,拟议的无语模型优于具有完整图像文本对训练的大多数现有型号。此外,我们的方法可以应用于微调预先训练的模型,它可以节省培训文本到图像生成模型的培训时间和成本。我们预先接受的模型在MS-Coco DataSet上获得竞争激烈的结果,在零拍摄的图像集中在MS-Coco DataSet上产生竞争结果,但距离最近提出的大型Dall-E型号的模型大小和培训数据大小约为1%。
translated by 谷歌翻译
当在条件属性上以某种方式相关的实例时,发生预测问题的不一致不会遵循决策属性的相同关系。例如,在具有单调性约束的序数分类中,当在条件属性上占据另一个实例的实例已经分配给更糟糕的决策类时,会发生它。它通常出现在由不完全知识(缺少属性)或通过数据生成期间发生的随机效果引起的数据的扰动(在决策属性值的评估中的不稳定性)引起的数据中的扰动。可以使用符号方法如粗糙集理论等象征方法处理和涉及优化方法的统计/机器学习方法,处理相对于清晰的预购关系(表达实例之间的差异或实例之间的无漏能格)不一致。模糊粗糙集也可以被视为对模糊关系处理不一致的象征性方法。在本文中,我们介绍了一种新的机器学习方法,用于对模糊预订关系进行不一致处理。新颖的方法是由用于清脆关系的现有机器学习方法的激励。我们为IT提供统计基础,并开发可用于消除不一致的优化程序。本文还证明了重要的财产,并载有这些程序的教学例子。
translated by 谷歌翻译
我们提出了一种新的方法,以综合新姿势的人民观点。我们的新颖可分解渲染器能够从任何观点来合成高度现实的图像。我们的渲染器而不是经过基于网格的结构,而不是经过网格的结构,而是利用直接代表人类的底层骨骼结构的弥漫性高斯基元。渲染这些原语可以通过解码器网络转换成RGB图像的高维潜像。制剂产生了可以训练端到端的完全可分辨率的框架。我们展示了我们对人类3.6M和Panoptic Studio数据集的图像重建方法的有效性。我们展示了我们的方法如何用于个人之间的运动转移;新颖的观看综合从单个相机捕​​获的个体;从任何虚拟角度扫描个体;并重新渲染新颖的姿势。代码和视频结果在https://github.com/guillaumerochette/humanviewsynthesis中获得。
translated by 谷歌翻译
虽然扩散概率模型可以产生高质量的图像内容,但仍然存在高分辨率图像的关键限制及其相关的高计算要求。最近的矢量量化图像模型已经克服了图像分辨率的这种限制,而是通过从之前的元素 - 明智的自回归采样生成令牌时,这是对图像分辨率的速度和单向的。相比之下,在本文中,我们提出了一种新的离散扩散概率模型,其通过使用无约束的变压器架构作为骨干来支持矢量量化令牌的并行预测。在培训期间,令牌以订单不可知的方式随机掩盖,变压器学会预测原始令牌。这种矢量量化令牌预测的并行性反过来促进了在计算费用的一小部分下的全球一致的高分辨率和多样性图像的无条件生成。以这种方式,我们可以产生超过原始训练集样本的图像分辨率,而另外提供每个图像似然估计(从生成的对抗方法的差点)。我们的方法在密度方面实现了最先进的结果(Lsun卧室:1.51; Lsun Churches:1.12; FFHQ:1.20)和覆盖范围(Lsun卧室:0.83; Lsun Churches:0.73; FFHQ:0.80),并执行竞争对手(LSUN卧室:3.64; LSUN教堂:4.07; FFHQ:6.11)在计算和减少训练套件要求方面提供优势。
translated by 谷歌翻译
图式是通过允许模型将复杂的任务分解为中间步骤来帮助人工智能的复杂任务的结构化表示。我们提出了一种新颖的系统,它引导了来自网络视频的模式,并通过提高视频检索性能的目标来概括他们捕获看不见的任务。我们的系统在三个主要阶段进行:(1)给定有关相关视频的任务,我们使用联合视频文本模型构造一个任务的初始模式,以匹配具有从WikiHow的文本的文本的视频片段; (2)通过利用语言模型来编辑现有模式中的文本来概括模式以解除任务。通过泛化,我们可以允许我们的模式涵盖具有少量学习数据的更广泛的任务; (3)我们将零拍摄的教学视频检索与未经说明的任务名称进行查询。我们的架构引导方法优于现有的视频检索方法,我们证明我们系统引起的模式优于其他模型产生的方法。
translated by 谷歌翻译
有条件的价值 - 风险(CVAR)精确地表征了稀有,灾难性事件可以在决策中施加的影响。这些表征对于正常决策和焦虑症(如焦虑症)的精神病条件都很重要 - 特别是对于最终可能导致灾难的决定序列。Cvar,如其他良好的风险措施,在这些序列中以复杂的方式化合物 - 并且我们最近正式地形成了三种结构不同的形式,其中风险平均或乘法。不幸的是,现有的认知任务未能辨别这些方法;在这里,我们提供了突出其独特特征的示例,并使正式的链接到时间折扣,这两种方法是一致的。这些例子可以将未来的实验与更广泛的实验进行了成绩,表征风险态度,特别是对于更长的地平线问题和精神病理学人群。
translated by 谷歌翻译
分类加强学习(RL) - 其中代理人了解其行动的所有可能的长期后果,而不仅仅是预期的价值 - 最近的兴趣。分配视图的最重要可接受性之一是在结果不完全确定的情况下促进现代,测量的,风险的风险。相比之下,在风险下决策的心理和神经科学调查利用了各种更令人尊敬的理论模型,例如缺乏公理理想的性质,例如连贯性。在这里,我们考虑了用于建模人类和动物规划的风险措施,称为有条件的价值 - 风险(CVAR),这量化了最坏情况结果(例如,车辆事故或捕食)。我们首先在连续的情况下采用传统的分布方法,在序列环境中,在众所周知的两步任务中重新分析人类决策者的选择,揭示了在粘性和坚持下潜伏的大量风险厌恶。然后,我们考虑风险敏感性的进一步关键特性,即时间一致性,显示出这种形式的CVAR的替代品,享受这种理想的特征。我们使用模拟来检查各种形式的设置,其中各种形式因对人类和动物规划和行为而产生影响的方式。
translated by 谷歌翻译
为了在结构因果模型(SCM)中执行反事实推理,需要了解因果机制,它提供条件分布的因子,并将噪声映射到样本的确定性函数。遗憾的是,因象无法通过观察和与世界互动收集的数据唯一确定的因果机制,因此仍然存在如何选择因果机制的问题。最近的工作中,Oberst&Sontag(2019)提出了Gumbel-Max SCM,它由于直观上吸引的反事实稳定性而导致Gumbel-Max Reparameterizations作为因果机制。在这项工作中,我们认为选择在估算反事实治疗效果时最小化的定量标准的因果机制,例如最小化方差。我们提出了一个参数化的因果机制,概括了Gumbel-Max。我们表明他们可以接受培训,以最大限度地减少对感兴趣查询的分布的反事实效果方差和其他损失,从而产生比固定替代方案的反复治疗效果的较低方差估计,也推广到在培训时间未见的查询。
translated by 谷歌翻译