在本文中,我们研究了随机环境中主要广义特征向量计算和典型相关分析的问题。我们提出了一个简单而有效的算法Gen-Oja来解决这些问题。我们证明了算法的全局收敛性,借鉴了理论混合马尔可夫链和两时间尺度随机逼近的思想,表明它达到了最优收敛速度。在这个过程中,我们开发工具来理解马尔可夫噪声的随机过程,这可能是独立的兴趣。
translated by 谷歌翻译
ArCo是意大利文化遗产知识图,由七个词汇网络和1.69亿个三倍体组成,约有82万个文化实体。它与SPARQL端点,用于将目录记录转换为RDF的软件以及丰富的文档材料(测试,评估,操作方法,示例等)共同分发。 ArCo基于意大利文化遗产和活动部(MiBAC)的官方总目录 - 及其相关的编码规则 - 收集和验证(理想情况下)CH管理员提供的所有意大利文化遗产特性(不包括图书馆和档案馆)的目录记录。遍布意大利。我们介绍其结构,设计方法和工具,其增长社区,并描述其重要性,质量和影响。
translated by 谷歌翻译
我们在有符号图中引入了一个原理和理论上合理的声谱方法,用于$ k $ -wayclustering,其中节点之间的亲和度度量采用正值或负值。我们的方法是由社会平衡理论推动的,其中聚类的任务旨在分解网络的联合群体,使得同一群体中的个体通过尽可能多的正边缘连接,而来自不同群体的个体通过尽可能多的负边缘连接。 。我们的算法依赖于最近关于约束聚类的工作启发的时间特征问题公式。通过利用矩阵微扰理论和随机矩阵理论的工具,我们为签署随机块模型的方法提供理论保证。对合成数据和实际数据进行了大量的数值实验表明,我们的方法与最先进的有符号聚类方法相比,特别是对于大量聚类和稀疏测量图。
translated by 谷歌翻译
机器人系统越来越能够自动化和完成互补任务,特别是依赖于智能系统,深度学习和人工智能方面的最新进展。然而,随着机器人和人类在相互作用中越来越紧密,人类机器人决策过程的解释性或可解释性问题变得越来越重要。通过相互理解环境的基本表示和手头的任务,可以实现成功的互动和协作。这是目前在学习系统中的一个挑战。我们提出了一个分层深度强化学习系统,由一个低级代理组成,它通过遵循高级代理的指令来有效地处理机器人系统的大动作/状态空间,该代理正在学习环境和任务的高级动态。 。这个高级代理形成了一个世界的代表和手头的任务,可以为人类操作员解释。我们称之为Dot-to-Dot的方法,在基于MuJoCo的Fetch Robotics Manipulator模型以及aShadow Hand上进行了测试,以测试其性能。结果显示低级代理有效地学习复杂的动作/状态空间,以及由高级代理学习的任务和决策过程的可解释的代表。
translated by 谷歌翻译
许多真实世界的应用程序产生了大型异构网络,其中节点和边缘可以是任意类型(例如,用户,网页,位置)。这种异构图的特殊情况包括同构图,二分,k-分段,有符号,标记图表,以及许多其他人。在这项工作中,我们将网络图案的概念概括为异构网络。特别是,引入了称为类型图(异构网络图案)的小型诱导类型子图,并显示为复杂异构网络的基本构建块。类型化的graphlet是graphlet(网络主题)到异构网络的概念的强大概括,因为它们捕获感兴趣的诱导子图和与诱导子图中的节点相关联的类型。为了解决这个问题,我们提出了一个快速,并行且节省空间的框架,用于计算大型网络中的类型图。我们发现低阶($ k-1 $) - 节点类型的graphlet之间存在非平凡的组合关系,并利用它们在$ o(1)$ constant time中导出许多$ k $ -node类型的graphlet。因此,我们避免对那些类型化的graphlet进行显式枚举。值得注意的是,时间复杂度与最佳的无类型graphlet计算算法相匹配。实验证明了所提出的框架在运行时,空间效率,并行加速和可扩展性方面的有效性,因为它能够处理大规模网络。
translated by 谷歌翻译
脓毒症是ICU死亡的主要原因。管理具有挑战性,因为个体患者对治疗的反应不同。因此,为个体患者定制治疗对于最佳结果至关重要。在本文中,我们通过应用专家专家框架来个性化败血症治疗,从而实现这一目标。混合模型根据患者的当前历史选择性地在基于邻居(核心)和深度加强学习(DRL)专家之间交替。在一个大型回顾性队列中,这种基于混合物的方法优于医生,核心和仅限DRL的专家。
translated by 谷歌翻译
有组织犯罪以种族灭绝的规模造成人类痛苦:墨西哥贩毒集团自2006年以来已经杀害了15万人,每年有超过70万人被“出口”在人口贩运行业,估计有4千万人受奴役。这些邪恶的行业依靠复杂的洗钱计划来运作。尽管有大量资源用于反洗钱(AML),但只有一小部分非法活动被预防。研究界可以提供帮助。在这篇简短的论文中,我们描绘了推动技术挑战的结构和行为动态。我们审查了AML方法,当前和紧急。我们首先介绍了可扩展的图形卷积神经网络,用于财务数据的取证分析,这是大规模,密集和动态的。我们使用由称为AMLSim的数据模拟器生成的大型合成图(1M节点,9M边)报告初步实验结果。我们在计算和内存方面考虑了高性能效率的机会,并且我们从简单的图形压缩实验中分享结果。我们的结果支持我们的工作假设,即AML的深度学习图在打击犯罪金融活动方面具有很大的前景。
translated by 谷歌翻译
本文介绍了TakeFive,一种新的语义角色标注方法,将文本转换为面向框架的知识图。它执行依赖性分析,识别唤起词汇框架的单词,定位每个框架的角色和填充程序,运行强制技术,并将结果形式化为知识图。这种形式表示符合Framester中使用的帧语义,Framester是一种事实语言链接数据资源。获得的精度,召回率和F1值表明,TakeFive与SEMAFOR,Pikes,PathLSTM和FRED等其他现有方法相比具有竞争力。我们最后讨论了如何结合使用TakeFive和FRED,获得更高的精度,召回和F1值。
translated by 谷歌翻译
混合线性回归是对数据集执行线性回归拟合的问题,对于该数据集,独立样本与观察之间的对应关系是未知的。这样的问题出现在各种领域,例如计算机视觉,通信和生物学。在其最简单的形式中,它解释了线性方程组,其右侧矢量的条目已经被置换。这种类型的数据破坏使线性回归任务变得更加困难,即使在没有其他损坏的情况下,例如噪声,异常值或缺少条目。现有方法要么仅适用于无噪声数据,要么对初始化非常敏感,仅适用于部分洗牌数据。在本文中,我们通过代数几何方法来解决这两个问题,它使用对称多项式来提取排列不变约束,线性回归模型的参数$ \ boldsymbol {x} \ in \ mathbb {R} ^ n $必须满足。这自然导致$ n $ unknowns中$ n $方程的多项式系统,其根轨迹中包含$ \ boldsymbol {x} $。使用代数几何的机器,我们证明只要独立样本是通用的,这个多项式系统总是与最多$ n!$复杂的根一致,而不管观察结果造成什么类型​​的腐败。这个事实的算法含义是,人们可以总是解决这个多项式系统并使用其最合适的根作为期望最大化算法的初始化。据我们所知,这种结果方法是第一个小值$ n $的工作解决方案,能够在几毫秒内处理数千个完全混乱的噪声观测值。
translated by 谷歌翻译
高阶连通模式,例如称为子图(网络图案)的小型诱导子图,对于理解管理复杂网络的配置和行为的重要组件(模块/功能单元)至关重要。高阶聚类中的现有工作集中于具有单个节点/边缘类型的简单多样图。然而,由不同类型的节点和边缘组成的异构图在现实世界中似乎无处不在。在这项工作中,我们引入了typed-graphlet的概念,即明确地捕获异构网络中的丰富(类型)连接模式。使用typed-graphlets作为基础,我们为异构网络中的高阶聚类开发了一般原理框架。该框架为所获得的高阶聚类的最优性提供了数学保证。实验证明了框架定量对三个重要应用的有效性,包括(i)聚​​类,(ii)链接预测,以及(iii)图形压缩。特别是,该方法比所有方法和图表的集群平均提高了43倍,同时分别实现了链路预测和图形压缩的18.7%和20.8%的改进。
translated by 谷歌翻译