智能论文笔记

ML-Based Approach for NFL Defensive Pass Interference Prediction Using GPS Tracking Data

Arian Skoki , Jonatan Lerga , Ivan Štajduhar

分类：机器学习 | 人工智能

2022-06-24

防御性通行干扰（DPI）是NFL中最有影响力的处罚之一。 DPI是一个犯规的犯规，首先是自动的，该团队拥有。有了对游戏的影响，裁判没有犯错的余地。这也是一个非常罕见的事件，每100次通行证尝试发生1-2次。随着技术的改进，将许多物联网可穿戴设备放在运动员那里以收集有价值的数据，因此，应用机器学习（ML）技术有一个坚实的基础来改善游戏的各个方面。这里介绍的工作是使用播放器跟踪GPS数据预测DPI的首次尝试。在2018年常规赛中，NFL的下一个Gen Stats收集了我们使用的数据。我们提出了高度不平衡时间序列分类的ML模型：LSTM，GRU，ANN和多元LSTM-FCN。结果表明，使用GPS跟踪数据预测DPI的成功有限。最佳性能模型的召回率很高，因此导致许多假阳性示例的分类。仔细观察数据证实，没有足够的信息来确定是否犯规。这项研究可能是用于视频序列分类的多步管道的过滤器，可以解决此问题。

translated by 谷歌翻译

VREN: Volleyball Rally Dataset with Expression Notation Language

Haotian Xia , Rhys Tracy , Yun Zhao , Erwan Fraisse , Yuan-Fang Wang , Linda Petzold

分类：机器学习

2022-09-28

这项研究旨在实现两个目标：第一个目标是策划一个大型且信息丰富的数据集，其中包含有关球员的行动和位置的关键和简洁的摘要，以及在专业和NCAA中排球的来回旅行模式Div-i室内排球游戏。尽管几项先前的研究旨在为其他运动创建类似的数据集（例如羽毛球和足球），但尚未实现为室内排球创建这样的数据集。第二个目标是引入排球描述性语言，以充分描述游戏中的集会过程并将语言应用于我们的数据集。基于精选的数据集和我们的描述性运动语言，我们使用我们的数据集介绍了三项用于自动化排球行动和战术分析的任务：（1）排球拉力赛预测，旨在预测集会的结果，并帮助球员和教练改善决策制定决策在实践中，（2）设置类型和命中类型预测，以帮助教练和球员更有效地为游戏做准备，以及（3）排球策略和进攻区统计，以提供高级排球统计数据，并帮助教练了解游戏和对手的策略更好的。我们进行了案例研究，以展示实验结果如何为排球分析社区提供见解。此外，基于现实世界数据的实验评估为我们的数据集和语言的未来研究和应用建立了基准。这项研究弥合了室内排球场与计算机科学之间的差距。

translated by 谷歌翻译

Group Activity Recognition in Basketball Tracking Data -- Neural Embeddings in Team Sports (NETS)

Sandro Hauri , Slobodan Vucetic

分类：机器学习

2022-08-31

像许多团队运动一样，篮球涉及两组球员，他们从事合作和对抗性活动以赢得比赛。球员和团队正在执行各种复杂的策略，以比对手获得优势。定义，识别和分析不同类型的活动是体育分析中的一项重要任务，因为它可以导致球员和教练人员更好地策略和决策。本文的目的是自动识别篮球小组的活动，从跟踪代表玩家和球的位置的数据。我们在团队运动中提出了一种新颖的深度学习方法，以称为NETS。为了有效地对团队运动中的玩家关系进行建模，我们将基于变压器的体系结构与LSTM嵌入结合在一起，以及一个团队合并层以识别小组活动。培训这样的神经网络通常需要大量注释数据，这会产生高标签成本。为了解决手动标签的稀缺性，我们在自我监督的轨迹预测任务上生成弱标签并预处理神经网络。我们使用了从632个NBA游戏中的大型跟踪数据集来评估我们的方法。结果表明，NET能够以高准确性学习小组活动，并且网络中的自我监督训练对GAR的准确性产生了积极影响。

translated by 谷歌翻译

Automatic event detection in football using tracking data

Ferran Vidal-Codina , Nicolas Evans , Bahaeddine El Fakir , Johsan Billingham

分类：机器学习

2022-02-01

近年来，足球事件数据的主要缺点之一是广泛用于分析，它仍然需要手动收集，因此将其可用性限制在减少的比赛中。在这项工作中，我们提出了一种确定性决策基于决策的算法，以使用跟踪数据自动提取足球事件，该数据包括两个步骤：（1）一个拥有步骤，该步骤评估哪个玩家在跟踪中的每个帧中都拥有球，数据以及在球没有发挥作用的时间间隔内的不同播放器配置来告知固定片段的检测；（2）结合了第一步中计算出的球拥有的变化与足球定律，以确定游戏中的事件并设定作品。自动生成的事件针对手动注释的事件进行了基准测试，我们表明，在大多数事件类别中，所提出的方法可以在不同的比赛和跟踪数据提供商中实现$+90 \％$检测率。最后，我们演示了如何利用跟踪数据提供的上下文信息来增加自动检测事件的粒度，并展示如何使用所提出的框架在足球中进行无数的数据分析。

translated by 谷歌翻译

Combining Sequential and Aggregated Data for Churn Prediction in Casual Freemium Games

Jeppe Theiss Kristensen , Paolo Burelli

分类：人工智能 | 机器学习

2022-09-06

在免费增值游戏中，玩家的收入来自于应用内购买以及该玩家所曝光的广告。玩家玩游戏越长，他或她将在游戏中产生收入的机会就越高。在这种情况下，能够及时检测玩家即将退出比赛（Churn）以做出反应并尝试将玩家保留在游戏中，从而延长他或她的游戏寿命非常重要。在本文中，我们调查了如何通过使用不同的神经网络体系结构组合顺序和汇总数据来改善流失预测中最新的最新预测。比较分析的结果表明，两种数据类型的组合可以根据纯粹的顺序或纯聚合数据来提高预测准确性比预测因子。

translated by 谷歌翻译

Location analysis of players in UEFA EURO 2020 and 2022 using generalized valuation of defense by estimating probabilities

Rikuhei Umemoto , Kazushi Tsutsui , Keisuke Fujii

分类：机器学习

2022-11-30

Analyzing defenses in team sports is generally challenging because of the limited event data. Researchers have previously proposed methods to evaluate football team defense by predicting the events of ball gain and being attacked using locations of all players and the ball. However, they did not consider the importance of the events, assumed the perfect observation of all 22 players, and did not fully investigated the influence of the diversity (e.g., nationality and sex). Here, we propose a generalized valuation method of defensive teams by score-scaling the predicted probabilities of the events. Using the open-source location data of all players in broadcast video frames in football games of men's Euro 2020 and women's Euro 2022, we investigated the effect of the number of players on the prediction and validated our approach by analyzing the games. Results show that for the predictions of being attacked, scoring, and conceding, all players' information was not necessary, while that of ball gain required information on three to four offensive and defensive players. With game analyses we explained the excellence in defense of finalist teams in Euro 2020. Our approach might be applicable to location data from broadcast video frames in football games.

translated by 谷歌翻译

Player Tracking and Identification in Ice Hockey

Kanav Vats , Pascale Walters , Mehrnaz Fani , David A. Clausi , John Zelek

分类：计算机视觉

2021-10-06

跟踪和识别玩家是基于计算机视觉冰球分析的基本步骤。跟踪生成的数据用于许多其他下游任务，例如游戏事件检测和游戏策略分析。播放器跟踪和识别是一个具有挑战性的问题，因为与行人相比，曲棍球运动员的运动是快节奏和非线性的。还有显着的摄像头淘气和放大曲棍球广播视频。识别冰球中的玩家是挑战，因为同一团队的球员几乎相同，泽西号码是玩家之间唯一的鉴别因素。本文介绍了一种用于跟踪和识别广播NHL曲棍球视频中的玩家的自动化系统。该系统由三个组件（1）播放器跟踪组成，（2）团队识别和（3）播放器识别。由于没有公开可用的数据集，用于培训三个组件的数据集手动注释。利用艺术跟踪算法的状态来执行播放器跟踪，从而获得多目标跟踪精度（MOTA）得分为94.5％。对于团队识别，Away-Team Jerseys被分组为单一课程，并根据他们的泽西颜色在课堂上分组。然后在团队识别数据集上培训卷积神经网络。团队识别网络在测试集中获得97％的准确性。引入了一种新颖的播放器识别模型，其利用时间一维卷积网络来识别来自玩家边界框序列的玩家。播放器识别模型进一步利用了可用的NHL游戏名册数据，以获得83％的玩家识别精度。

translated by 谷歌翻译

Graph Neural Networks to Predict Sports Outcomes

Peter Xenopoulos , Claudio Silva

分类：机器学习

2022-07-28

预测体育运动对球队，联赛，投注者，媒体和球迷来说很重要。鉴于越来越多的播放器跟踪数据，体育分析模型越来越多地利用在播放器跟踪数据上构建的空间衍生功能。但是，由于常见的建模技术依赖于矢量输入，因此不能轻易地将特定于玩家的信息作为功能本身包含。因此，通过空间衍生的特征是根据锚定对象（例如，通过全球功能聚合或通过角色签名方案）构建的，例如，球员在游戏中被指定在游戏中具有独特的作用。在这样做的过程中，我们牺牲了人际关系和地方关系，而是支持全球关系。为了解决这个问题，我们介绍了基于运动的图形表示游戏状态。然后，我们将建议的图表表示作为图形神经网络的输入来预测运动结果。我们的方法可以保留置换不变性，并允许灵活的播放互动权重。我们展示了我们的方法如何为美术和电子竞技的预测任务提供对艺术的统计学显着改善，从而将测试套装损失分别减少了9％和20％。此外，我们展示了如何使用我们的模型来回答运动中的“如果”问题并可视化玩家之间的关系。

translated by 谷歌翻译

Valuing Players Over Time

Tiago Mendes-Neves , Luís Meireles , João Mendes-Moreira

分类：机器学习

2022-09-08

在足球（或协会足球）中，球员迅速从英雄转变为零，反之亦然。性能不是静态度量，而是一种易变的措施。将绩效分析为时间序列而不是静止的时间点对于做出更好的决策至关重要。本文介绍并探讨了I-VAEP和O-VAEP模型，以评估行动和评估玩家的意图和执行。然后，我们随着时间的推移分析这些评级，并提出用例，以基本将我们将玩家评分视为连续问题的选择。结果，我们出席了谁是最好的球员以及他们的表现如何发展，定义波动率指标以衡量球员的一致性，并建立玩家发展曲线以帮助决策。

translated by 谷歌翻译

Explainable expected goal models for performance analysis in football analytics

Mustafa Cavus , Przemysław Biecek

分类：机器学习

2022-06-14

预期的目标提供了对球队和球员表现的更具代表性的衡量标准，这也适合足球的低分性质，而不是现代足球比赛。比赛的得分涉及随机性，并且通常不能代表球队和球员的表现，因此近年来使用替代统计数据（例如目标，球控球和钻探）是很受欢迎的。为了衡量射击的可能性是预期目标的目标，使用了一些功能来训练基于事件并跟踪足球数据的预期目标模型。这些功能的选择，数据的大小和日期以及可能影响模型性能的参数。使用黑框机器学习模型来提高模型的预测性能，可降低其可解释性，从而导致可以从模型中收集的信息丢失。本文提出了一个准确的预期目标模型，该模型由2014 - 15年至2020 - 21年欧洲前五名的欧洲足球联赛的七个赛季中的315,430张训练。此外，通过使用可解释的人工智能工具来获取可解释的预期目标模型来评估团队或球员性能。据我们所知，这是第一篇论文，该论文展示了可解释的人工智能工具汇总配置文件的实际应用，以解释一组观察结果，以进行准确的预期目标模型，以监视团队和球员绩效。此外，这些方法可以推广到其他运动分支。

translated by 谷歌翻译

ESTA: An Esports Trajectory and Action Dataset

Peter Xenopoulos , Claudio Silva

分类：机器学习

2022-09-20

体育由于其全球影响力和影响力丰富的预测任务，是部署机器学习模型的令人兴奋的领域。但是，由于其规模，准确性和可访问性，传统运动的数据通常不适合研究使用。为了解决这些问题，我们转向电子竞技，这是一个越来越多的域，它涵盖了类似于传统体育的视频游戏。由于电子竞技数据是通过服务器日志而不是外围传感器获取的，因此电子竞技提供了一个独特的机会来获得大量清洁和详细的时空数据，类似于传统运动中收集的数据。为了解析电子竞技数据，我们开发了AWPY，这是一个开源电子竞技游戏日志解析库，可以从游戏日志中提取玩家轨迹和动作。使用AWPY，我们可以从1,558个游戏日志中解析86万动作，79万游戏帧和417K轨迹，从专业的反击比赛中创建电子竞技轨迹和动作（ESTA）数据集。埃斯塔（ESTA）是迄今为止最大，最颗粒状的公共运动数据集之一。我们使用ESTA来开发基准，以使用特定于玩家的信息进行赢得预测。 ESTA数据可在https://github.com/pnxenopoulos/esta上获得，并且AWPY通过PYPI公开。

translated by 谷歌翻译

Going for GOAL: A Resource for Grounded Football Commentaries

Alessandro Suglia , José Lopes , Emanuele Bastianelli , Andrea Vanzo , Shubham Agarwal , Malvina Nikandrou , Lu Yu , Ioannis Konstas , Verena Rieser

分类：计算机视觉 | 自然语言处理

2022-11-08

Recent video+language datasets cover domains where the interaction is highly structured, such as instructional videos, or where the interaction is scripted, such as TV shows. Both of these properties can lead to spurious cues to be exploited by models rather than learning to ground language. In this paper, we present GrOunded footbAlL commentaries (GOAL), a novel dataset of football (or `soccer') highlights videos with transcribed live commentaries in English. As the course of a game is unpredictable, so are commentaries, which makes them a unique resource to investigate dynamic language grounding. We also provide state-of-the-art baselines for the following tasks: frame reordering, moment retrieval, live commentary retrieval and play-by-play live commentary generation. Results show that SOTA models perform reasonably well in most tasks. We discuss the implications of these results and suggest new tasks for which GOAL can be used. Our codebase is available at: https://gitlab.com/grounded-sport-convai/goal-baselines.

translated by 谷歌翻译

Evaluation of creating scoring opportunities for teammates in soccer via trajectory prediction

Masakiyo Teranishi , Kazushi Tsutsui , Kazuya Takeda , Keisuke Fujii

分类：人工智能 | 机器学习

2022-06-04

评估足球运动员队友的个人运动对于评估队伍，侦察和粉丝的参与至关重要。据说，在90分钟的比赛中，球员平均没有大约87分钟的球。但是，在不接球的情况下评估进攻球员并揭示运动如何为队友创造得分机会的贡献一直很困难。在本文中，我们评估了通过将实际动作与通过轨迹预测产生的参考运动进行比较来评估创建球外评分机会的玩家。首先，我们使用图形差异神经网络预测玩家的轨迹，该神经网络可以准确地模拟玩家之间的关系并预测长期轨迹。接下来，基于实际运动轨迹和预测轨迹之间修改的外球评估指数的差异，我们评估实际运动与预测运动相比如何促进得分机会。为了进行验证，我们研究了专家一年中专业球队的所有比赛的年薪，目标和比赛的关系。结果表明，年薪和拟议的指标与现有指标和目标无法解释。我们的结果表明，该方法作为没有球的球员为队友创造得分机会的指标的有效性。

translated by 谷歌翻译

Ice hockey player identification via transformers

Kanav Vats , William McNally , Pascale Walters , David A. Clausi , John S. Zelek

分类：计算机视觉

2021-11-22

识别视频中的玩家是基于计算机视觉的体育分析的基础步骤。获得播放器标识对于分析游戏至关重要，并且用于游戏事件识别等下游任务。变压器是自然语言处理（NLP）的现有标准，并在计算机视觉中迅速获得牵引力。在计算机愿景中的变压器成功增加的推动，在本文中，我们介绍了一种通过广播国家曲棍球联赛（NHL）视频的泽西号码来识别玩家的变压器网络。变压器将玩家帧的时间序列（也称为播放器轨迹）作为输入，输出帧中存在的泽西号码的概率。所提出的网络比使用数据集上的上一个基准测试更好。我们通过为泽西号码的近似帧级标签产生近似帧级标签来实现弱监督的培训方法，并使用帧级标签以更快的培训。我们还通过使用光学字符识别（OCR）阅读游戏时间来利用NHL游戏数据中提供的玩家换档，以在某种游戏时间内将玩家放在溜冰场上。使用播放器转换将播放器识别精度提高了6％。

translated by 谷歌翻译

Intra-domain and cross-domain transfer learning for time series data -- How transferable are the features?

Erik Otović , Marko Njirjak , Dario Jozinović , Goran Mauša , Alberto Michelini , Ivan Štajduhar

分类：机器学习

2022-01-12

在实践中，非常苛刻，有时无法收集足够大的标记数据数据集以成功培训机器学习模型，并且对此问题的一个可能解决方案是转移学习。本研究旨在评估如何可转让的时间序列数据和哪些条件下的不同域之间的特征。在训练期间，在模型的预测性能和收敛速度方面观察到转移学习的影响。在我们的实验中，我们使用1,500和9,000个数据实例的减少数据集来模仿现实世界的条件。使用相同的缩小数据集，我们培训了两组机器学习模型：那些随着转移学习的培训和从头开始培训的机器学习模型。使用四台机器学习模型进行实验。在相同的应用领域（地震学）以及相互不同的应用领域（地震，语音，医学，金融）之间进行知识转移。我们在训练期间遵守模型的预测性能和收敛速度。为了确认所获得的结果的有效性，我们重复了实验七次并应用了统计测试以确认结果的重要性。我们研究的一般性结论是转移学习可能会增加或不会对模型的预测性能或其收敛速度产生负面影响。在更多细节中分析收集的数据，以确定哪些源域和目标域兼容以用于传输知识。我们还分析了目标数据集大小的效果和模型的选择及其超参数对转移学习的影响。

translated by 谷歌翻译

Predicting Football Match Outcomes with eXplainable Machine Learning and the Kelly Index

Yiming Ren , Teo Susnjak

分类：机器学习

2022-11-28

In this work, a machine learning approach is developed for predicting the outcomes of football matches. The novelty of this research lies in the utilisation of the Kelly Index to first classify matches into categories where each one denotes the different levels of predictive difficulty. Classification models using a wide suite of algorithms were developed for each category of matches in order to determine the efficacy of the approach. In conjunction to this, a set of previously unexplored features were engineering including Elo-based variables. The dataset originated from the Premier League match data covering the 2019-2021 seasons. The findings indicate that the process of decomposing the predictive problem into sub-tasks was effective and produced competitive results with prior works, while the ensemble-based methods were the most effective. The paper also devised an investment strategy in order to evaluate its effectiveness by benchmarking against bookmaker odds. An approach was developed that minimises risk by combining the Kelly Index with the predefined confidence thresholds of the predictive models. The experiments found that the proposed strategy can return a profit when following a conservative approach that focuses primarily on easy-to-predict matches where the predictive models display a high confidence level.

translated by 谷歌翻译

SC2EGSet: StarCraft II Esport Replay and Game-state Dataset

Andrzej Białecki , Natalia Jakubowska , Paweł Dobrowolski , Piotr Białecki , Leszek Krupiński , Andrzej Szczap , Robert Białecki , Jan Gajewski

分类：机器学习 | 人工智能 | (统计)机器学习

2022-07-07

作为一种相对较新的运动形式，电子竞技提供了无与伦比的数据可用性。尽管游戏发动机生成的大量数据，但提取它们并验证其完整性以实用和科学用途的目的是具有挑战性的。我们的工作旨在通过提供来自Starcraft II电子竞技锦标赛的原始文件和预处理的文件来向更广泛的科学界开放电子竞技。这些文件可用于统计和机器学习建模任务，并与各种基于实验室的测量（例如行为测试，脑成像）相关。我们已经收集了公开可用的游戏发动机，生成了比赛的“重播”，并使用低级应用程序编程界面（API）Parser库进行了数据提取和清理。此外，我们开源并发布了在创建数据集过程中开发的所有自定义工具。这些工具包括Pytorch和Pytorch Lightning API抽象来加载和建模数据。我们的数据集包含自2016年以来的主要和Premiere Starcraft II锦标赛的重播。为了准备数据集，我们处理了55个锦标赛的“ replaypacks”，其中包含17930个带有游戏状态信息的文件。根据对可用的星际争霸II数据集的初步调查，我们观察到我们的数据集是其出版物后最大的星际争霸II电子竞技数据的最大可用来源。对提取数据的分析有望在各种受监督和自我监督的任务中进行进一步的人工智能（AI），机器学习（ML），心理学，人工互动（HCI）和与运动有关的研究。

translated by 谷歌翻译

Predicting the Geoeffectiveness of CMEs Using Machine Learning

Andreea-Clara Pricopi , Alin Razvan Paraschiv , Diana Besliu-Ionescu , Anca-Nicoleta Marginean

分类：机器学习

2022-06-23

冠状质量弹出（CME）是最地理化的空间天气现象，与大型地磁风暴有关，有可能引起电信，卫星网络中断，电网损失和故障的干扰。因此，考虑到这些风暴对人类活动的潜在影响，对CME的地理效果的准确预测至关重要。这项工作着重于在接近太阳CME的白光冠状动脉数据集中训练的不同机器学习方法，以估计这种新爆发的弹出是否有可能诱导地磁活动。我们使用逻辑回归，k-nearest邻居，支持向量机，向前的人工神经网络以及整体模型开发了二进制分类模型。目前，我们限制了我们的预测专门使用太阳能发作参数，以确保延长警告时间。我们讨论了这项任务的主要挑战，即我们数据集中的地理填充和无效事件的数量以及它们的众多相似之处以及可用变量数量有限的极端失衡。我们表明，即使在这种情况下，这些模型也可以达到足够的命中率。

translated by 谷歌翻译

Esports Data-to-commentary Generation on Large-scale Data-to-text Dataset

Zihan Wang , Naoki Yoshinaga

分类：自然语言处理

2022-12-21

Esports, a sports competition using video games, has become one of the most important sporting events in recent years. Although the amount of esports data is increasing than ever, only a small fraction of those data accompanies text commentaries for the audience to retrieve and understand the plays. Therefore, in this study, we introduce a task of generating game commentaries from structured data records to address the problem. We first build a large-scale esports data-to-text dataset using structured data and commentaries from a popular esports game, League of Legends. On this dataset, we devise several data preprocessing methods including linearization and data splitting to augment its quality. We then introduce several baseline encoder-decoder models and propose a hierarchical model to generate game commentaries. Considering the characteristics of esports commentaries, we design evaluation metrics including three aspects of the output: correctness, fluency, and strategic depth. Experimental results on our large-scale esports dataset confirmed the advantage of the hierarchical model, and the results revealed several challenges of this novel task.

translated by 谷歌翻译

MARIO: Modular and Extensible Architecture for Computing Visual Statistics in RoboCup SPL

Domenico D. Bloisi , Andrea Pennisi , Cristian Zampino , Flavio Biancospino , Francesco Laus , Gianluca Di Stefano , Michele Brienza , Rocchina Romano

分类：计算机视觉

2022-09-20

该技术报告描述了在Robocup SPL（Mario）中计算视觉统计的模块化且可扩展的体系结构，该结构在Robocup 2022的SPL Open Research Challenge期间提出，该挑战在曼谷（泰国）举行。马里奥（Mario）是一个开源的，可用的软件应用程序，其最终目标是为Robocup SPL社区的发展做出贡献。Mario带有一个GUI，该GUI集成了多个机器学习和基于计算机视觉的功能，包括自动摄像机校准，背景减法，同型计算，玩家 +球跟踪和本地化，NAO机器人姿势估计和跌落检测。马里奥（Mario）被排名第一。1在开放研究挑战中。

translated by 谷歌翻译