了解文档图像(例如,发票)是一个重要的研究主题,并在文档处理自动化中具有许多应用。通过基于深度学习的光学字符识别(OCR)的最新进展,目前的视觉文档了解(VDU)系统已经基于OCR设计。虽然这种基于OCR的方法承诺合理的性能,但它们遭受了由OCR引起的关键问题,例如(1)(1)昂贵的计算成本和(2)由于OCR误差传播而导致的性能下降。在本文中,我们提出了一种新颖的VDU模型,即结束可训练而不支撑OCR框架。为此,我们提出了一个新的任务和合成文档图像生成器,以预先列车,以减轻大规模实体文档图像上的依赖关系。我们的方法在公共基准数据集和私营工业服务数据集中了解各种文档的最先进的性能。通过广泛的实验和分析,我们展示了拟议模型的有效性,特别是考虑到真实世界的应用。
translated by 谷歌翻译
结邦化是一种非扰动过程,无法从第一原理推导出理论描述。建模强子地层,需要几种假设和各种现象学方法。利用最先进的计算机视觉和深度学习算法,最终可以训练神经网络以学习物理过程的非线性和非扰动特征。在本研究中,通过调查全局和运动量,确实喷射和事件形状变量来呈现两个Reset网络的结果。广泛使用的焊串碎片模型应用于$ \ sqrt {s} = 7 $ tev proton-proton碰撞中的基线,以预测进一步的LHC能量的最相关的可观察者。
translated by 谷歌翻译
最近,已经开发了方法以准确地预测其在特定任务上的深神经网络(DNN)的测试性能,给定其底层拓扑结构的统计数据。然而,进一步利用这一新发现的实际应用的洞察力由于时间和记忆的高计算成本,因此是棘手的。在这项工作中,我们定义了一类新的拓扑功能,可以准确地表征学习的进度,同时在运行时迅速计算。此外,我们所提出的拓扑功能易于配备反向化,这意味着它们可以在最终训练中纳入其中。我们的新开发的DNN实际拓扑表征允许额外的应用程序。我们首先显示我们可以预测没有测试集的DNN的性能,而无需高性能计算。我们还证明了我们对DNN的拓扑表征在估计任务相似性方面是有效的。最后,我们表明我们可以通过主动限制DNN的拓扑结构来诱导DNN中的学习。这使得在元学框架中收缩了DNN的基础结构来开辟了新的途径。
translated by 谷歌翻译
深度神经网络拥有的一个重要股权是在以前看不见的数据上对分发检测(OOD)进行强大的能力。在为现实世界应用程序部署模型时,此属性对于安全目的至关重要。最近的研究表明,概率的生成模型可以在这项任务上表现不佳,这令他们寻求估计培训数据的可能性。为了减轻这个问题,我们提出了对变分性自动化器(VAE)的指数倾斜的高斯先前分配。通过此之前,我们能够使用VAE自然分配的负面日志可能性来实现最先进的结果,同时比某些竞争方法快的数量级。我们还表明,我们的模型生产高质量的图像样本,这些样本比标准高斯VAE更清晰。新的先前分配具有非常简单的实现,它使用kullback leibler发散,该kullback leibler发散,该横向leibler发散,该分解比较潜伏向量的长度与球体的半径之间的差异。
translated by 谷歌翻译
对于光滑的强凸目标,梯度下降的经典理论可确保相对于梯度评估的数量的线性收敛。一个类似的非球形理论是具有挑战性的:即使目标在每一次迭代的目标流畅时,相应的本地模型也是不稳定的,传统的补救措施需要不可预测的许多切割平面。我们提出了对局部优化的梯度下降迭代的多点概括。虽然设计了一般目标,但我们受到“最大平滑”模型的动机,可在最佳状态下捕获子样本维度。当目标本身自象最大的情况时,我们证明了线性融合,并且实验表明了更普遍的现象。
translated by 谷歌翻译
许多应用程序,例如移动机器人或自动车辆,使用LIDAR传感器获得有关其三维周围环境的详细信息。许多方法使用图像类似的凸起以有效地处理这些激光雷达测量并使用深卷积神经网络来预测扫描中的每个点的语义类。空间固定假设能够使用卷曲。然而,LIDAR扫描在垂直轴上表现出大的差异。因此,我们提出了半本地卷积(SLC),卷积层,沿垂直尺寸减少的重量分配量减少。我们首先要调查这种层独立于任何其他模型变化的层。我们的实验在细分或准确性方面没有显示出传统卷积层的任何改善。
translated by 谷歌翻译
单代理(SA)强化学习系统在非稳定性问题上表现出突出的重新解决。但是,多智能体增强学习(Marl)通常可以超越SA系统,并且在缩放时。此外,MASYSTEMS可以通过协作来超级支持,这可能通过OB-SENT IDS,或用于共享CORLABORATOR之间的信息的通信系统发生。在这里,我们开发了一种分布式MA学习机制,其能够基于分散的部分可观察的Markovdecision(Dec-POMDPS)和图形神经网络(GNN)进行通信的能力。训练机学习模型消耗的时间和精力最小,可以通过协作MA机制实现性能。在现实世界的情景中,这是一个近海风电场,包括一组套装的风力发电机,目的是最大化集体效率。对于SA系统,MA协作表现出显着降低的时间和更高累积的奖励在看不见的缩放方案。
translated by 谷歌翻译
高分辨率气象雷达图像的可用性是有效的预测和决策。在超越传统雷达覆盖范围之外,生成模型已成为一种重要的合成能力,融合更普遍的数据来源,例如卫星图像和数值天气模型,进入准确的雷达样产品。在这里,我们展示了使用量子辅助模型来增强传统卷积神经网络的方法,用于全球合成天气雷达中的生成任务。我们表明Quantum Kernels原则上可以根据相关底层数据上的古典学习机来表现出基本上更复杂的任务。我们的结果建立了合成气象雷达作为量子计算能力的有效启发式基准,并在高影响力的相关问题上设定了详细量子优势基准测试的阶段。
translated by 谷歌翻译
海洋生态系统模型的参数识别对于对船舶生态系统模型的评估和验证对观察数据进行评估和验证。基于代理的优化(SBO)是一种计算复杂模型的计算有效方法。 SBO通过从不太准确但计算性更便宜(低保真)模型的代理代替计算昂贵的(高保真)模型,与适当的校正方法组合,这提高了低保真模型的准确性。为了构建计算廉价的低保真模型,我们测试了三种不同的方法来计算海洋生态系统模型的年度周期性解决方案(即稳定年度周期)的近似:首先,减少旋转迭代次数(几个几十年而不是千年),其次,一个人工神经网络(ANN)近似稳定年度周期,最后是两种方法的组合。除了仅使用ANN的低保真模型外,SBO会产生靠近目标的解决方案,并显着降低了计算工作。如果ANN近似于适当的海洋生态系统模型,则使用该ANN的SBO作为低保真模型,提供了验证的有希望和计算有效的方法。
translated by 谷歌翻译
我们展示了MapReader,一个在Python中编写的免费开源软件库,用于分析大地图集合(扫描或出生)。此库转换历史人员可以通过转动广泛的均匀地图设置到可搜索的主要源来使用映射的方式。 MapReader允许使用很少或没有计算机视觉专业知识的用户来通过Web服务器检索地图; ii)预处理并将它们分成补丁; iii)涂布补丁; iv)火车,微调和评估深度神经网络模型; v)创建有关地图内容的结构化数据。我们展示了MAPREADER如何使历史学家解释$ \ \左右16千世纪的军械调查地图表($ \大约30.5M补丁),将视觉标记转化为机器可读数据的挑战。我们展示了一个案例研究,重点是英国铁路基础设施和建筑物,如这些地图所示。我们还展示了MapReader管道的输出如何链接到我们用于评估的其他外部数据集以及丰富和解释结果。我们释放$ \大约62万美元手动注释的补丁,用于培训和评估模型。
translated by 谷歌翻译