了解文档图像(例如,发票)是一个重要的研究主题,并在文档处理自动化中具有许多应用。通过基于深度学习的光学字符识别(OCR)的最新进展,目前的视觉文档了解(VDU)系统已经基于OCR设计。虽然这种基于OCR的方法承诺合理的性能,但它们遭受了由OCR引起的关键问题,例如(1)(1)昂贵的计算成本和(2)由于OCR误差传播而导致的性能下降。在本文中,我们提出了一种新颖的VDU模型,即结束可训练而不支撑OCR框架。为此,我们提出了一个新的任务和合成文档图像生成器,以预先列车,以减轻大规模实体文档图像上的依赖关系。我们的方法在公共基准数据集和私营工业服务数据集中了解各种文档的最先进的性能。通过广泛的实验和分析,我们展示了拟议模型的有效性,特别是考虑到真实世界的应用。
translated by 谷歌翻译
单代理(SA)强化学习系统在非稳定性问题上表现出突出的重新解决。但是,多智能体增强学习(Marl)通常可以超越SA系统,并且在缩放时。此外,MASYSTEMS可以通过协作来超级支持,这可能通过OB-SENT IDS,或用于共享CORLABORATOR之间的信息的通信系统发生。在这里,我们开发了一种分布式MA学习机制,其能够基于分散的部分可观察的Markovdecision(Dec-POMDPS)和图形神经网络(GNN)进行通信的能力。训练机学习模型消耗的时间和精力最小,可以通过协作MA机制实现性能。在现实世界的情景中,这是一个近海风电场,包括一组套装的风力发电机,目的是最大化集体效率。对于SA系统,MA协作表现出显着降低的时间和更高累积的奖励在看不见的缩放方案。
translated by 谷歌翻译
我们证明了深度神经网络(NNS)的损失景观的一般嵌入原理,其解除了NNS的损失景观的层次结构,即NN的损失景观包含所有较窄NN的所有关键点。通过构建一类临界嵌入来获得该结果,该临界嵌入物将较窄的Nn的任何临界点映射到具有相同输出功能的目标Nn的临界点。通过发现广泛的一般兼容性嵌入式,我们提供了嵌入来自NNS的关键点的关键子多种尺寸的总估计。我们进一步证明了任何临界嵌入的Irfreversiblility属性,即临界点的Hessian矩阵的负/零/正小叶值的数量可能增加,但由于NN通过嵌入越来越宽,因此从未减少。使用一般兼容的临界嵌入的特殊实现,我们证明了一个严格的必要条件,以便是一个完全不变的临界点,从未成为任何关键嵌入的严格鞍端。该结果暗示宽NNS中严格鞍点的常见,这可能是在实践中广泛观察到的宽NNS易于优化的重要原因。
translated by 谷歌翻译
考虑以下模型,以研究对意见形成的对抗性影响。一套最初选择的专家形成了他们的二进制意见,同时受到反对者的影响,他们可能会说服他们一些虚假的谎言。网络中的所有其他参与者然后对其大多数邻近专家的意见。对手可以影响专家,使大多数网络相信虚假的方式吗?Alon等人。[1]召集认为,在这种情况下,迭代传播过程将始终有利于对手。这项工作为该猜想提供了一个反例。[1] N.Alon,M. Feldman,O. Lev,以及M. Tennenholtz。人群的智慧是多么强大?在第24届国际人工智能联席会议(IJCAI 2015年),2015年第2055-2061页的第24届国际联席会议。
translated by 谷歌翻译
深度加强学习(RL)的增长为该领域带来了多种令人兴奋的工具和方法。这种快速扩展使得了解RL工具箱的各个元素之间的相互作用。通过在连续控制环境中进行研究,我们从实证角度接近这项任务。我们提出了对基本性质的多个见解,包括:从相同数据培训的多个演员的平均值提升了性能;现有方法在培训运行,培训时期,培训时期和评估运行不稳定;有效培训不需要常用的添加剂动作噪声;基于后抽样的策略探讨比近似的UCB与加权Bellman备份相结合的探讨;单独加权的Bellman备份不能取代剪辑的双Q学习;批评者的初始化在基于集合的演员批评探索中起着重要作用。作为一个结论,我们展示了现有的工具如何以新颖的方式汇集,产生集合深度确定性政策梯度(ED2)方法,从Openai Gyem Mujoco的连续控制任务产生最先进的结果。从实际方面,ED2在概念上简单,易于编码,并且不需要在现有RL工具箱之外的知识。
translated by 谷歌翻译
本文侧重于跨数据库微表达识别的研究,其中培训和测试微表达样本属于不同的微表达数据库。训练与测试微表达特征之间的不匹配特征分布降低了最良好性能的微表达方法的性能。要处理跨数据库微表达式识别,我们提出了一种名为Transfer组稀疏回归(TGSR)的新型域适应方法。TGSR了解稀疏的回归矩阵,用于选择突出面部本地区域和训练集和测试集的相应关系。我们在Casme II和SMIC数据库中评估我们的TGSR模型。实验结果表明,建议的TGSR实现了令人满意的性能和优于基于最先进的子空间学习的域适应方法。
translated by 谷歌翻译
我们介绍了一个新的真实值不变,称为3范围内的双曲结的自然斜率,这在其CUSP几何形状中定义。我们展示了两倍的结签名,自然斜率在大多数恒定时间上不同的双曲线除以喷射率半径的立方体。使用机器学习发现这种不等式来检测各种结不变之间的关系。它有应用于Dehn手术和4球属的应用。我们还显示了一个精致版本的不等式,其中上限是体积的线性函数,并且斜率通过对应于链接结的短测地测量的术语来校正,该术语将结奇数次数。
translated by 谷歌翻译
生物学以及先进的人工智能(AIS)需要决定追求哪些目标。我们审查大自然的时间分配问题的解决方案,这是基于我们在省略的不断重新调整的分类权重机制作为情绪。人们观察到在系统到期的情况下,可用数量的情绪状态随着动物的认知能力而增加,筹集智力水平需要更大的行为选择。我们体验多种潜在冲突的感情的能力在于这一观点不是更原始的遗产,而是一种归属于在出生时不能指定的行为选项的值的通用机制。在这种观点中,情绪对于了解思想至关重要。为了具体性,我们提出并讨论了一种模仿功能水平情绪的框架。根据通过情绪化的(TAES)的时间分配,情绪被实施为抽象标准,例如满意,挑战和无聊,这有助于评估已经进行的活动。与代理商的“字符”进行比较所产生的经验性情绪,这在情绪状态的首选分布方面定义。通过优化选择各个任务的频率来实现代理的长期目标以使具有字符的经验。优化后,情感经验的统计数据变得静止。
translated by 谷歌翻译
研究进步使得在自主车辆中部署的神经网络算法来感知周围。用于感知环境的标准脱墨传感器是摄像机和潮羊段。因此,使用这些脱模传感器开发的神经网络算法已经为自主车辆的感知提供了必要的解决方案。这些脱离传感器的一个主要缺点是它们在恶劣天气条件下的可操作性,例如,低照明和夜间条件。自主车辆传感器套件中热摄像机的可供选择性和可负担能力为自主车辆在恶劣天气条件下的感知方面提供了必要的改进。环境的语义有利于鲁棒的感知,这可以通过在场景中分段不同的对象来实现。在这项工作中,我们使用了用于语义细分的热相机。我们设计了一个名为Artseg的基于关注的反复卷积网络(RCNN)编码器解码器架构,用于热语义分割。这项工作的主要贡献是编码器解码器架构的设计,该架构为每个编码器和解码器块使用RCNN的单位。此外,在解码器模块中采用添加剂注意力,以保持高分辨率特征并改善特征的定位。在可用的公共数据集中评估所提出的方法的功效,显示出与联盟(IOU)的均值交叉口的其他最先进方法更好的性能。
translated by 谷歌翻译
已经提出了概率语言学期来处理提供的语言评估中的概率分布。但是,由于它具有一些基本缺陷,决策者通常很难获得合理的语言评估对团体决策的信息。此外,权重信息在动态信息融合和决策过程中起着重要作用。但是,有很少的研究方法可以随时间确定动态属性权重。在本文中,我提出了双模糊概率间隔语言术语集(DFPilts)的概念。首先,模糊语义集成,DFPilts定义,其偏好关系,定义了一些基本算法和聚合运算符。然后,开发了一种具有网络的模糊语言马尔可夫矩阵。然后,开发了一种基于距离测量和信息熵的权重确定方法,从而减少DFPilpr的不一致并获得基于组共识的集体优先级向量。最后,开发了基于聚合的方法,以及来自财务风险的最佳投资情况用于说明DFPilts和决策方法在多标准决策中的应用。
translated by 谷歌翻译