目前,没有一致的模型用于在视觉上或正式地表示AI系统的架构。这种缺乏代表性在现有模型和系统的描述中带来了解释性,正确性和完整性挑战。 DIAL(图解人工智能语言)是为人工智能系统作为“工程原理图”的愿望而创建的。它在此作为AI系统的通用图解语言的社区对话的起点。
translated by 谷歌翻译
尽管最近在计算机视觉方面取得了进展,但由于缺乏标记的训练数据,卫星图像的细粒度解释仍然具有挑战性。为了克服这一局限性,我们通过将地理参考维基百科文章与其相应位置的卫星图像配对,构建了一个名为WikiSatNet的新数据集。然后,我们通过从图像中预测相应文章的属性,提出了两种策略来学习卫星图像的表示。利用这种新的多模态数据集,我们可以大幅减少人工注释标签的数量和下游任务所需的时间。在最近发布的fMoW数据集中,我们的预训练策略可以将预先训练的模型的性能提升高达4:5%的F1得分。
translated by 谷歌翻译
由于缺乏关于主要社会,环境和经济指标的数据缺乏,特别是在发展中国家,联合国可持续发展目标(SDG)的进展受到阻碍。例如,由于调查成本高,贫困数据 - 十七个可持续发展目标中的第一个 - 在撒哈拉以南非洲空间稀疏且不经常收集。在这里,我们提出了一种使用来自维基百科文章的开源,地理定位文本信息来估计社会经济指标的新方法。我们证明现代NLP技术可用于使用附近的地理定位维基百科文章来预测社区 - levelasset财富和教育成果。当与夜间卫星图像配对时,我们的方法优于所有先前发布的预测任务的基准,表明维基百科的潜力可以为两个研究提供信息。社会科学和未来的政策决定。
translated by 谷歌翻译
全世界有数百万人缺席他们国家的人口普查。准确,现有和细化的人口指标对于改善政府资源配置,衡量疾病控制,应对自然灾害以及研究这些社区人类生活的任何方面至关重要。卫星图像可以提供足够的信息来建立人口普查地图,而无需政府人口普查的成本和时间。我们提出了两种卷积神经网络(CNN)架构,它可以有效地组合来自多个源的卫星图像输入,以准确地预测一个区域的人口密度。在本文中,我们使用来自印度农村的卫星图像和2011年SECC人口普查的人口标签。我们的最佳模型比以前的纸张以及LandScan(全球人口分布的社区标准)实现了更好的性能。
translated by 谷歌翻译
推荐系统是个性化的信息访问应用程序;它们在当今的在线环境中无处不在,并且能够有效地找到满足用户需求和品味的项目。随着推荐系统的覆盖范围扩大,显而易见的是,一心一意地关注用户对学术研究的共同看法,模糊了推荐结果的其他重要方面。推荐人系统评估的典型指标未捕获公平性,平衡性,盈利性和互惠性等属性。多利益相关方推荐的概念已经成为描述和理解推荐设置的统一框架,而最终用户并不是唯一关注的焦点。本文介绍了多利益相关方推荐的起源以及系统设计的前景。它提供了当前研究的说明性示例,并概述了该领域的开放性和研究方向。
translated by 谷歌翻译
我们考虑通过随机梯度下降训练的深度网络来最小化L2损失,训练标签受到独立噪声扰动的迭代。我们在任意参数向量附近表征训练动力学的行为,该对应向量实现零训练误差,就与数据点之和相对应的隐式调节项而言,模型相对于参数向量的梯度的L2范数,在每个数据点。然后,我们利用这种一般特征,它适用于任何连接,宽度,深度和激活函数选择的网络,以显示对于具有一维标记数据$(x_1)的双向ReLU网络的任意宽度和L2损失。 ,y_1),\ ldots,(x_n,y_n),$唯一具有零trainingerror的稳定解决方案对应于以下函数:1)在任何一组三个或更多线性训练点上是线性的(即函数没有额外的“扭结” “); 2)改变凸度是拟合训练数据所需的最小次数。此外,对于任意宽度的双层网络,使用tanhor逻辑激活,我们表明,当训练单个$ d $ -dimensionalpoint $(x,y)$时,唯一稳定的解决方案对应于所有隐藏单元的激活的网络数据点以及从隐藏单元到输出的所有权重最多取两个不同的值,或者为零。从这个意义上说,我们表明,当对“简单”数据进行训练时,对应可控参数的模型也是“简单”的;简而言之,尽管适应过度参数化的制度,其中绝大多数可表达的功能复杂且表现不佳,但通过使用噪声表达训练达到的稳定参数几乎是与数据一致的“最简单可能”的假设。这些结果揭示了为什么会出现这样的谜团。深层网络在实践中概括得很好。
translated by 谷歌翻译
在这项工作中,我们提出了一种在时间图中嵌入节点的方法。我们提出了一种算法,该算法随时间学习时间图的节点的渐变,并将该动态结合在用于不同图形预测任务的时间节点嵌入框架中。我们提出了一种联合损失函数,其通过学习组合其历史时间嵌入​​来创建节点的时间嵌入,使得它优化每个给定任务(例如,链接预测)。该算法使用静态节点嵌入进行初始化,然后静态节点嵌入在不同时间点的节点表示上对齐,并最终在联合优化中适应给定任务。我们评估了我们的方法在各种时间图上的有效性,用于时间链路预测和多标签节点分类这两个基本任务,与竞争基线和算法替代方案相比较。我们的算法显示了许多数据集和基线的性能改进,并且对于具有较低聚类系数的无粘性图形尤其有效。
translated by 谷歌翻译
加权模型集成(WMI)将加权模型计数(WMC)扩展到混合离散连续域上的函数集成。它在解决图形模型和概率编程中的推理问题方面具有显着的前景。然而,WMI的最先进工具是有限的性能间隔,忽略了对提高效率至关重要的独立结构。为了解决这个局限性,我们提出了一种有效的模型积分算法,用于具有树原始图的理论。我们通过使用搜索来执行集成来利用稀疏图结构。我们的算法大大提高了这些问题的计算效率,并利用了变量之间的特定于文本的独立性。实验结果表明,与现有的WMI求解器相比,树形依赖性问题的实际加速比较。
translated by 谷歌翻译
本文提出了一种新的分类模型,称为逻辑电路。在ONMNIST和Fashion数据集中,我们的学习算法优于具有更多参数数量级的神经网络。然而,逻辑电路在符号AI中具有明显的起源,形成区别对应的拓扑逻辑电路,例如AC,SPN和PSDD。我们证明了逻辑电路的参数学习是凸优化,而简单的局部搜索算法可以从数据中引出强大的模型结构。
translated by 谷歌翻译
越来越多的可用数据导致了对代表大规模概率知识库的更高需求。一种方法是使用概率数据库,这是一种具有强大假设的模型,可以有效地回答许多有趣的查询。最近关于开放世界概率数据库的工作通过抛弃数据中不存在的任何信息必须是假的假设来加强这些概率数据库的语义。虽然直观,但这些语义并不足以为查询提供合理的答案。我们建议通过使用约束来限制这个开放世界来克服这些问题。我们为一类查询提供了算法,并建立了基本的硬度结果。最后,我们为大类查询提出了一种有效且紧密的近似。
translated by 谷歌翻译