在诸如足球和篮球之类的流体团队运动中,分析团队组合是从域名参与者的角度了解策略的最直观的方法之一。但是,现有方法要么假定团队组合在整个比赛中都是一致的,要么逐帧地编码,这不同意实际情况。为了解决这个问题,我们提出了一个名为SocCercPD的更改点检测框架,该框架区分了战术意图的形成和角色的变化与足球比赛的临时变化。我们首先将角色分配给玩家逐帧并执行两步更改点检测:(1)基于角色添加矩阵的序列和(2)基于角色变化矩阵的序列检测和(2)基于角色变更点检测角色排列顺序。使用域专家注释的地面真相对SOCCERCPD的评估表明,我们的方法准确地检测了战术变化的点,并估计每个细分市场的形成和角色分配。最后,我们介绍了域参与者可以轻松解释和使用的实用用例。
translated by 谷歌翻译
表征比赛风格对于足球俱乐部在侦察,监视和比赛准备方面非常重要。先前的研究将玩家的风格视为技术性能的结合,未能考虑空间信息。因此,这项研究旨在表征中国足球超级联赛(CSL)比赛中每种比赛位置的比赛风格,并集成了最近采用的玩家向量框架。使用了2016 - 2019年CSL的960匹匹配的数据。匹配等级和十种类型的匹配事件与所有阵容播放器的相应坐标均超过45分钟。球员首先被聚集在8个位置。使用非负矩阵分解(NMF),根据播放器向量为每个匹配中的每个玩家构建了播放器向量。在玩家向量上运行另一个NMF进程,以提取不同类型的游戏样式。最终的玩家向量在CSL中发现了18种不同的游戏风格。研究了每种样式的六个性能指标,以观察他们的贡献。总的来说,前锋和中场球员的比赛风格与足球表现的发展趋势一致,而应重新考虑防守者的风格。在高评分的CSL播放器中也发现了多功能游戏风格。
translated by 谷歌翻译
预测体育运动对球队,联赛,投注者,媒体和球迷来说很重要。鉴于越来越多的播放器跟踪数据,体育分析模型越来越多地利用在播放器跟踪数据上构建的空间衍生功能。但是,由于常见的建模技术依赖于矢量输入,因此不能轻易地将特定于玩家的信息作为功能本身包含。因此,通过空间衍生的特征是根据锚定对象(例如,通过全球功能聚合或通过角色签名方案)构建的,例如,球员在游戏中被指定在游戏中具有独特的作用。在这样做的过程中,我们牺牲了人际关系和地方关系,而是支持全球关系。为了解决这个问题,我们介绍了基于运动的图形表示游戏状态。然后,我们将建议的图表表示作为图形神经网络的输入来预测运动结果。我们的方法可以保留置换不变性,并允许灵活的播放互动权重。我们展示了我们的方法如何为美术和电子竞技的预测任务提供对艺术的统计学显着改善,从而将测试套装损失分别减少了9%和20%。此外,我们展示了如何使用我们的模型来回答运动中的“如果”问题并可视化玩家之间的关系。
translated by 谷歌翻译
在线多人游戏中游戏的复杂性产生了强烈的兴趣对玩家使用的不同游戏或策略进行建模。我们为在线多人游戏战场3开发了一个分层贝叶斯回归方法,其中性能被建模为角色,游戏类型和由该玩家在每个比赛中都采取的地图。我们之前使用Dirichlet进程,使得在我们的回归模型中具有类似玩家特定系数的玩家的聚类,这使我们能够在战场3个玩家的样本中发现常见的游戏样式。这种贝叶斯半导体聚类方法有几个优点:不需要指定常用播放样式的数量,玩家可以在多个集群之间移动,并且所产生的分组通常具有直接解释。我们详细审视战场3个玩家中最常见的游戏风格,并找到了展出整体高性能的玩家组,以及在特定游戏类型,地图和角色中表现特别良好的玩家的分组。我们还能够区分播放者,这些玩家是从混合播放器展示在其比赛中展出多种游戏风格的混合播放器的稳定成员。建模这种不同游戏风格的景观将帮助游戏开发人员开发新参与者的专门教程,并在在线匹配队列中提高互补团队的构建。
translated by 谷歌翻译
跟踪和识别玩家是基于计算机视觉冰球分析的基本步骤。跟踪生成的数据用于许多其他下游任务,例如游戏事件检测和游戏策略分析。播放器跟踪和识别是一个具有挑战性的问题,因为与行人相比,曲棍球运动员的运动是快节奏和非线性的。还有显着的摄像头淘气和放大曲棍球广播视频。识别冰球中的玩家是挑战,因为同一团队的球员几乎相同,泽西号码是玩家之间唯一的鉴别因素。本文介绍了一种用于跟踪和识别广播NHL曲棍球视频中的玩家的自动化系统。该系统由三个组件(1)播放器跟踪组成,(2)团队识别和(3)播放器识别。由于没有公开可用的数据集,用于培训三个组件的数据集手动注释。利用艺术跟踪算法的状态来执行播放器跟踪,从而获得多目标跟踪精度(MOTA)得分为94.5%。对于团队识别,Away-Team Jerseys被分组为单一课程,并根据他们的泽西颜色在课堂上分组。然后在团队识别数据集上培训卷积神经网络。团队识别网络在测试集中获得97%的准确性。引入了一种新颖的播放器识别模型,其利用时间一维卷积网络来识别来自玩家边界框序列的玩家。播放器识别模型进一步利用了可用的NHL游戏名册数据,以获得83%的玩家识别精度。
translated by 谷歌翻译
扬声器日流是一个标签音频或视频录制的任务,与扬声器身份或短暂的任务标记对应于扬声器标识的类,以识别“谁谈到何时发表讲话”。在早期,对MultiSpeaker录音的语音识别开发了扬声器日益衰退算法,以使扬声器自适应处理能够实现扬声器自适应处理。这些算法还将自己的价值作为独立应用程序随着时间的推移,为诸如音频检索等下游任务提供特定于扬声器的核算。最近,随着深度学习技术的出现,这在讲话应用领域的研究和实践中引起了革命性的变化,对扬声器日益改善已经进行了快速进步。在本文中,我们不仅审查了扬声器日益改善技术的历史发展,而且还审查了神经扬声器日益改善方法的最新进步。此外,我们讨论了扬声器日复速度系统如何与语音识别应用相结合,以及最近深度学习的激增是如何引领联合建模这两个组件互相互补的方式。通过考虑这种令人兴奋的技术趋势,我们认为本文对社区提供了有价值的贡献,以通过巩固具有神经方法的最新发展,从而促进更有效的扬声器日益改善进一步进展。
translated by 谷歌翻译
Current learning machines have successfully solved hard application problems, reaching high accuracy and displaying seemingly "intelligent" behavior. Here we apply recent techniques for explaining decisions of state-of-the-art learning machines and analyze various tasks from computer vision and arcade games. This showcases a spectrum of problem-solving behaviors ranging from naive and short-sighted, to wellinformed and strategic. We observe that standard performance evaluation metrics can be oblivious to distinguishing these diverse problem solving behaviors. Furthermore, we propose our semi-automated Spectral Relevance Analysis that provides a practically effective way of characterizing and validating the behavior of nonlinear learning machines. This helps to assess whether a learned model indeed delivers reliably for the problem that it was conceived for. Furthermore, our work intends to add a voice of caution to the ongoing excitement about machine intelligence and pledges to evaluate and judge some of these recent successes in a more nuanced manner.
translated by 谷歌翻译
对自然和人制过程的研究通常会导致长时间有序值的长序列,也就是时间序列(TS)。这样的过程通常由多个状态组成,例如机器的操作模式,使观测过程中的状态变化会导致测量值形状的分布变化。时间序列分割(TSS)试图发现TS事后的这种变化,以推断数据生成过程的变化。通常将TSS视为无监督的学习问题,目的是识别某些统计属性可区分的细分。 TSS的当前算法要求用户设置依赖域的超参数,对TS值分布进行假设或可检测更改的类型,以限制其适用性。常见的超参数是段均匀性和变更点的数量的度量,对于每个数据集,这尤其难以调节。我们提出了TSS的一种新颖,高度准确,无参数和域的无义方法的方法。扣子分层将TS分为两个部分。更改点是通过训练每个可能的拆分点的二进制TS分类器来确定的,并选择最能识别从任何一个分区的子序列的一个拆分。 CLASP使用两种新颖的定制算法从数据中学习了其主要的两个模型参数。在我们使用115个数据集的基准测试的实验评估中,我们表明,扣子优于准确性,并且可以快速且可扩展。此外,我们使用几个现实世界的案例研究强调了扣子的特性。
translated by 谷歌翻译
近年来,足球事件数据的主要缺点之一是广泛用于分析,它仍然需要手动收集,因此将其可用性限制在减少的比赛中。在这项工作中,我们提出了一种确定性决策基于决策的算法,以使用跟踪数据自动提取足球事件,该数据包括两个步骤:(1)一个拥有步骤,该步骤评估哪个玩家在跟踪中的每个帧中都拥有球,数据以及在球没有发挥作用的时间间隔内的不同播放器配置来告知固定片段的检测; (2)结合了第一步中计算出的球拥有的变化与足球定律,以确定游戏中的事件并设定作品。自动生成的事件针对手动注释的事件进行了基准测试,我们表明,在大多数事件类别中,所提出的方法可以在不同的比赛和跟踪数据提供商中实现$+90 \%$检测率。最后,我们演示了如何利用跟踪数据提供的上下文信息来增加自动检测事件的粒度,并展示如何使用所提出的框架在足球中进行无数的数据分析。
translated by 谷歌翻译
我们开发了一种新的方法,可以通过将无监督的学习应用于其波动结构来寻找非间断金融时间序列中的波动性制度的数量。我们使用更改点检测将时间序列分区为局部静止段,然后计算段分布之间的距离矩阵。通过优化例程将该段聚集成离散波动制度的学习次数。使用本框架,我们确定金融指数,大型股票,交易交易资金和货币对的波动聚类结构。我们的方法克服了实现许多参数系统切换模型所必需的刚性假设,同时有效地将时间序列蒸馏成几种特征行为。我们的结果提供了对这些时间序列的重大简化,以及对波动性的现有行为的强烈描述分析。最后,我们创建并验证了一种动态交易策略,该策略学习时间序列的当前分布与其过去的制度之间的最佳匹配,从而在目前进行在线风险避免决策。
translated by 谷歌翻译
诸如深度学习之类的复杂预测模型是拟合机器学习,神经网络或AI模型到一组培训数据的输出。这些现在是科学的标准工具。当前一代模型的一个关键挑战是它们是高度参数化的,这使得和解释预测策略变得困难。我们使用拓扑数据分析将这些复杂预测模型转换为代表拓扑视图的图片。结果是可以进行检查的预测的地图。这些方法扩展到跨不同领域的大型数据集,使我们能够检测训练数据中的错误,了解图像分类中的概括,并检查BRCA1基因中可能致病性突变的预测。
translated by 谷歌翻译
我们提出了新的WASSTEREIN图形集群,用于动态更改图形。Wassersein聚类惩罚了图之间的拓扑差异。Wassersein聚类显示出优于广泛使用的K-Means聚类。该方法应用于更准确地确定动态变化功能性脑网络的状态空间。
translated by 谷歌翻译
体育由于其全球影响力和影响力丰富的预测任务,是部署机器学习模型的令人兴奋的领域。但是,由于其规模,准确性和可访问性,传统运动的数据通常不适合研究使用。为了解决这些问题,我们转向电子竞技,这是一个越来越多的域,它涵盖了类似于传统体育的视频游戏。由于电子竞技数据是通过服务器日志而不是外围传感器获取的,因此电子竞技提供了一个独特的机会来获得大量清洁和详细的时空数据,类似于传统运动中收集的数据。为了解析电子竞技数据,我们开发了AWPY,这是一个开源电子竞技游戏日志解析库,可以从游戏日志中提取玩家轨迹和动作。使用AWPY,我们可以从1,558个游戏日志中解析86万动作,79万游戏帧和417K轨迹,从专业的反击比赛中创建电子竞技轨迹和动作(ESTA)数据集。埃斯塔(ESTA)是迄今为止最大,最颗粒状的公共运动数据集之一。我们使用ESTA来开发基准,以使用特定于玩家的信息进行赢得预测。 ESTA数据可在https://github.com/pnxenopoulos/esta上获得,并且AWPY通过PYPI公开。
translated by 谷歌翻译
像许多团队运动一样,篮球涉及两组球员,他们从事合作和对抗性活动以赢得比赛。球员和团队正在执行各种复杂的策略,以比对手获得优势。定义,识别和分析不同类型的活动是体育分析中的一项重要任务,因为它可以导致球员和教练人员更好地策略和决策。本文的目的是自动识别篮球小组的活动,从跟踪代表玩家和球的位置的数据。我们在团队运动中提出了一种新颖的深度学习方法,以称为NETS。为了有效地对团队运动中的玩家关系进行建模,我们将基于变压器的体系结构与LSTM嵌入结合在一起,以及一个团队合并层以识别小组活动。培训这样的神经网络通常需要大量注释数据,这会产生高标签成本。为了解决手动标签的稀缺性,我们在自我监督的轨迹预测任务上生成弱标签并预处理神经网络。我们使用了从632个NBA游戏中的大型跟踪数据集来评估我们的方法。结果表明,NET能够以高准确性学习小组活动,并且网络中的自我监督训练对GAR的准确性产生了积极影响。
translated by 谷歌翻译
在足球(或协会足球)中,球员迅速从英雄转变为零,反之亦然。性能不是静态度量,而是一种易变的措施。将绩效分析为时间序列而不是静止的时间点对于做出更好的决策至关重要。本文介绍并探讨了I-VAEP和O-VAEP模型,以评估行动和评估玩家的意图和执行。然后,我们随着时间的推移分析这些评级,并提出用例,以基本将我们将玩家评分视为连续问题的选择。结果,我们出席了谁是最好的球员以及他们的表现如何发展,定义波动率指标以衡量球员的一致性,并建立玩家发展曲线以帮助决策。
translated by 谷歌翻译
Multi-agent artificial intelligence research promises a path to develop intelligent technologies that are more human-like and more human-compatible than those produced by "solipsistic" approaches, which do not consider interactions between agents. Melting Pot is a research tool developed to facilitate work on multi-agent artificial intelligence, and provides an evaluation protocol that measures generalization to novel social partners in a set of canonical test scenarios. Each scenario pairs a physical environment (a "substrate") with a reference set of co-players (a "background population"), to create a social situation with substantial interdependence between the individuals involved. For instance, some scenarios were inspired by institutional-economics-based accounts of natural resource management and public-good-provision dilemmas. Others were inspired by considerations from evolutionary biology, game theory, and artificial life. Melting Pot aims to cover a maximally diverse set of interdependencies and incentives. It includes the commonly-studied extreme cases of perfectly-competitive (zero-sum) motivations and perfectly-cooperative (shared-reward) motivations, but does not stop with them. As in real-life, a clear majority of scenarios in Melting Pot have mixed incentives. They are neither purely competitive nor purely cooperative and thus demand successful agents be able to navigate the resulting ambiguity. Here we describe Melting Pot 2.0, which revises and expands on Melting Pot. We also introduce support for scenarios with asymmetric roles, and explain how to integrate them into the evaluation protocol. This report also contains: (1) details of all substrates and scenarios; (2) a complete description of all baseline algorithms and results. Our intention is for it to serve as a reference for researchers using Melting Pot 2.0.
translated by 谷歌翻译
This paper proposes a graph-based approach to representing spatio-temporal trajectory data that allows an effective visualization and characterization of city-wide traffic dynamics. With the advance of sensor, mobile, and Internet of Things (IoT) technologies, vehicle and passenger trajectories are being increasingly collected on a massive scale and are becoming a critical source of insight into traffic pattern and traveller behaviour. To leverage such trajectory data to better understand traffic dynamics in a large-scale urban network, this study develops a trajectory-based network traffic analysis method that converts individual trajectory data into a sequence of graphs that evolve over time (known as dynamic graphs or time-evolving graphs) and analyses network-wide traffic patterns in terms of a compact and informative graph-representation of aggregated traffic flows. First, we partition the entire network into a set of cells based on the spatial distribution of data points in individual trajectories, where the cells represent spatial regions between which aggregated traffic flows can be measured. Next, dynamic flows of moving objects are represented as a time-evolving graph, where regions are graph vertices and flows between them are treated as weighted directed edges. Given a fixed set of vertices, edges can be inserted or removed at every time step depending on the presence of traffic flows between two regions at a given time window. Once a dynamic graph is built, we apply graph mining algorithms to detect change-points in time, which represent time points where the graph exhibits significant changes in its overall structure and, thus, correspond to change-points in city-wide mobility pattern throughout the day (e.g., global transition points between peak and off-peak periods).
translated by 谷歌翻译
在过去二十年中,识别具有不同纵向数据趋势的群体的方法已经成为跨越许多研究领域的兴趣。为了支持研究人员,我们总结了文献关于纵向聚类的指导。此外,我们提供了一种纵向聚类方法,包括基于基团的轨迹建模(GBTM),生长混合模拟(GMM)和纵向K平均值(KML)。该方法在基本级别引入,并列出了强度,限制和模型扩展。在最近数据收集的发展之后,将注意这些方法的适用性赋予密集的纵向数据(ILD)。我们展示了使用R.中可用的包在合成数据集上的应用程序的应用。
translated by 谷歌翻译
该技术报告描述了在Robocup SPL(Mario)中计算视觉统计的模块化且可扩展的体系结构,该结构在Robocup 2022的SPL Open Research Challenge期间提出,该挑战在曼谷(泰国)举行。马里奥(Mario)是一个开源的,可用的软件应用程序,其最终目标是为Robocup SPL社区的发展做出贡献。Mario带有一个GUI,该GUI集成了多个机器学习和基于计算机视觉的功能,包括自动摄像机校准,背景减法,同型计算,玩家 +球跟踪和本地化,NAO机器人姿势估计和跌落检测。马里奥(Mario)被排名第一。1在开放研究挑战中。
translated by 谷歌翻译
我们介绍了一个新型的多层加权网络模型,该模型除了本地信号外,还考虑了全局噪声。该模型类似于多层随机块模型(SBM),但关键区别在于,跨层之间的块之间的相互作用在整个系统中是常见的,我们称之为环境噪声。单个块还以这些固定的环境参数为特征,以表示不属于其他任何地方的成员。这种方法允许将块同时聚类和类型化到信号或噪声中,以便更好地理解其在整个系统中的作用,而现有块模型未考虑。我们采用了分层变异推断的新颖应用来共同检测和区分块类型。我们称此模型为多层加权网络称为随机块(具有)环境噪声模型(SBANM),并开发了相关的社区检测算法。我们将此方法应用于费城神经发育队列中的受试者,以发现与精神病有关的具有共同心理病理学的受试者社区。
translated by 谷歌翻译