AI / Compling在Scale是一个难题,特别是在医疗保健环境中。我们概述了要求,规划和实施选择,以及导致我们安全的研究计算平台,埃森医疗计算平台(EMCP)的实施的指导原则,与德国主要医院隶属。遵从性,数据隐私和可用性是系统的不可变的要求。我们将讨论我们的计算飞地的功能,我们将为希望采用类似设置的团体提供我们的配方。
translated by 谷歌翻译
预计人工神经网络的领域将强烈受益于量子计算机的最新发展。特别是Quantum Machine Learning,一类利用用于创建可训练神经网络的Qubits的量子算法,将提供更多的力量来解决模式识别,聚类和机器学习等问题。前馈神经网络的构建块由连接到输出神经元的一层神经元组成,该输出神经元根据任意激活函数被激活。相应的学习算法以Rosenblatt Perceptron的名义。具有特定激活功能的量子感知是已知的,但仍然缺乏在量子计算机上实现任意激活功能的一般方法。在这里,我们用量子算法填充这个间隙,该算法能够将任何分析激活功能近似于其功率系列的任何给定顺序。与以前的提案不同,提供不可逆转的测量和简化的激活功能,我们展示了如何将任何分析功能近似于任何所需的准确性,而无需测量编码信息的状态。由于这种结构的一般性,任何前锋神经网络都可以根据Hornik定理获取通用近似性质。我们的结果重新纳入栅极型量子计算机体系结构中的人工神经网络科学。
translated by 谷歌翻译
这项工作调查了基于课程学习(CL)对代理商的绩效的影响。特别是,我们专注于机器人毛美导航的安全方面,比较标准端到端(E2E)培训策略。为此,我们提出了一种方法,即利用学习(tol)和微调在基于团结的模拟中的微调,以及Robotnik Kairos作为机器人代理。对于公平的比较,我们的评估考虑了对每个学习方法的同等计算需求(即,相同的相互作用和环境的难度数),并确认我们基于CL的方法使用TOL优于E2E方法。特别是,我们提高了培训的政策的平均成功率和安全,导致看不见的测试方案中的碰撞减少了10%。为了进一步确认这些结果,我们采用正式的验证工具来量化加强学习政策的正确行为数量超过所需规范。
translated by 谷歌翻译
批量标准化是所有最先进的神经网络架构的必要组件。然而,由于引入了许多实际问题,最近的研究已经致力于设计无规范化的架构。在本文中,我们表明权重初始化是培训Reset的归一化网络的关键。特别是,我们提出了对跳过连接分支的块输出的求和操作的略微修改,从而正确初始化整个网络。我们表明,这种修改的体系结构在CiFar-10上实现了竞争结果,而无需进一步正常化,也不是算法修改。
translated by 谷歌翻译
我们提出了一种离散化设计,阐述了最近在Gagliardi和Russo(2021)中引入的算法,以合成来自约束,可能随机和非线性系统的示例的控制策略。在可能嘈杂的示例数据中不需要满足约束,这又可以从不同于控制的系统中收集。对于这种离散设计,我们讨论了许多属性并提供设计管道。我们术语作为离散的完全概率设计的设计在数值上基准测试,该示例涉及从从没有满足系统特定的致动约束的物理上不同的摆动的数据开始的致动约束的致动约束的致动约束。
translated by 谷歌翻译
在学习从观察数据中学习贝叶斯网络的图形结构是描述和帮助了解复杂应用程序中的数据生成过程的关键,而任务由于其计算复杂性而构成了相当大的挑战。代表贝叶斯网络模型的定向非循环图(DAG)通常不会从观察数据识别,并且存在各种方法来估计其等价类。在某些假设下,流行的PC算法可以通过测试条件独立(CI)一致地始终恢复正确的等价类,从边际独立关系开始,逐步扩展调节集。这里,我们提出了一种通过利用协方差与精密矩阵之间的反向关系来执行PC算法内的CI测试的新颖方案。值得注意的是,精密矩阵的元素与高斯数据的部分相关性。然后,我们的算法利用对协方差和精密矩阵的块矩阵逆转,同时对互补(或双)调节集的部分相关性进行测试。因此,双PC算法的多个CI测试首先考虑边缘和全阶CI关系并逐步地移动到中心顺序。仿真研究表明,双PC算法在运行时和恢复底层网络结构方面都优于经典PC算法。
translated by 谷歌翻译
我们提出了一种专注于水生导航的安全强化学习的新型基准环境。由于非静止的环境和机器人平台的不确定性,水生导航是一个极具挑战性的任务,因此通过分析训练有素的网络的行为来考虑问题的安全方面至关重要的问题,以避免危险情况(例如,碰撞)。为此,我们考虑基于价值和政策梯度的深度加强学习(DRL),我们提出了一种基于交叉的策略,将基于梯度和梯度的DRL结合以提高样品效率。此外,我们提出了一种基于间隔分析的验证策略,该验证策略检查培训模型在一组所需属性上的行为。我们的结果表明,基于交叉的培训优于先前的DRL方法,而我们的验证允许我们量化违反属性描述的行为的配置数。至关重要,这将作为该应用领域的未来研究的基准。
translated by 谷歌翻译
我们研究了流行的集中训练和分散执行(CTDE)范式中的多机器人发臭导航问题。当每个机器人考虑其路径而不明确地与其他机器人明确分享观察时,这一问题挑战了,可能导致深度加强学习(DRL)中的非静止问题。典型的CTDE算法将联合动作值函数分解为个别函数,以支持合作并实现分散的执行。这种分解涉及限制(例如,单调性),其限制在个体中的新行为的出现,因为从联合动作值开始训练。相比之下,我们为CTDE提出了一种新颖的架构,该架构使用集中式状态值网络来计算联合状态值,该值用于在代理的基于值的更新中注入全局状态信息。因此,考虑到环境的整体状态,每个模型计算其权重的梯度更新。我们的想法遵循Dueling Networks作为联合状态值的单独估计的独立估计,具有提高采样效率的优点,同时提供每个机器人信息,无论全局状态是否为(或不是)有价值的。具有2 4和8个机器人的机器人导航任务的实验,确认了我们对先前CTDE方法的方法的卓越性能(例如,VDN,QMIX)。
translated by 谷歌翻译
当自我监督的模型已经显示出比在规模上未标记的数据训练的情况下的监督对方的可比视觉表现。然而,它们的功效在持续的学习(CL)场景中灾难性地减少,其中数据被顺序地向模型呈现给模型。在本文中,我们表明,通过添加将表示的当前状态映射到其过去状态,可以通过添加预测的网络来无缝地转换为CL的蒸馏机制。这使我们能够制定一个持续自我监督的视觉表示的框架,学习(i)显着提高了学习象征的质量,(ii)与若干最先进的自我监督目标兼容(III)几乎没有近似参数调整。我们通过在各种CL设置中培训六种受欢迎的自我监督模型来证明我们的方法的有效性。
translated by 谷歌翻译
多核和高度连接的架构已成为无处不在的,这为基于语言的剥削的方法带来了更新的兴趣。自成立以来,逻辑编程已被认为是一种编程范例,具有巨大的自动开发并行性。 2001年出版的“并行逻辑编程研究”对并行逻辑编程研究的综合调查曾作为对研究人员和开发人员的基本提及。目前内容非常有效,但同时该领域在遵循的岁月中继续快速发展。这些成就和持续的研究已经受到技术创新的快速速度驱动的,这导致了非常大的集群,多核处理器广泛扩散,普通目的图形处理单元的游戏变化作用以及云计算的无处不在的采用。这一直在逻辑编程中的显着进展并行于显着的静态分析和验证,答案集编程的快速增长,以及一般,更成熟的实现和系统。本次调查介绍了自2001年以来的并行逻辑编程研究的审查,从而提供了先前调查的自然延续。该调查的目标不仅可以作为逻辑编程系统的研究人员和开发人员的参考,而且还可以作为对逻辑感兴趣的任何人的阅读以及作为并行系统外的研究人员的有用来源的阅读。逻辑编程理论与实践的考虑(TPLP)。
translated by 谷歌翻译