一致性检查技术使我们能够评估某些表现出的行为,以一系列受监视的事件表示,符合指定的过程模型。现代监测和活动识别技术,例如依靠传感器,物联网,统计和AI的技术,可以产生大量相关的事件数据。但是,与符合检查算法所需的确定性事件对数的假设相反,该数据通常以噪声和不确定性为特征。在本文中,我们将基于对齐的一致性检查扩展到概率事件日志下的功能。我们介绍了一个概率痕量模型和对齐成本函数,以及一个自定义阈值参数,该参数控制事件数据与过程模型的信任水平。与传统比对相比,在存在足够高的可能性的对齐事件的情况下,所得算法得出的适应性得分提高,因此假阳性偏差较少。我们从形式和直观的角度来解释算法及其动机,并与使用一组理论示例相比,证明了其功能与确定性对齐相比。
translated by 谷歌翻译
在这项工作中,我们提出了一种从随机已知的日志中恢复的算法,这种设置越来越普遍,随着传感器数量的增加和产生不确定数据的预测模型。建议的方法计算过程模型与随机已知的痕迹之间的符合性,并在此随机迹线中恢复最佳对齐,作为真实痕迹。本文提供了各种成本模型对痕量恢复准确性的影响的分析,并利用产品多刷子来比较替代的跟踪恢复选项。我们使用两个公开数据集进行评估的方法的平均准确性令人印象深刻,平均恢复精度得分为90-97%,显着改善了一种共同的启发式,它为每种不确定的活动选择了最可能的价值。我们认为,拟议算法从随机已知的日志中恢复正确的痕迹的有效性可能是在不确定的环境中开发可靠的决策工具的有力帮助。
translated by 谷歌翻译
现实生活过程的日志通常具有与记录的时间戳,数据值和/或事件有关的不确定性。我们考虑检查不确定日志与数据吸引参考过程的不确定日志的问题。具体来说,我们展示了如何通过SMT编码来解决它,从而将基于数据感知的SMT符合性检查的先前工作提升为更复杂的设置。我们的方法是模块化的,因为它同质可容纳不同类型的不确定性。此外,使用适当的成本功能,可以解决不同的符合性检查任务。我们通过概念验证实施来展示我们的方法的正确性,并见证了可行性。
translated by 谷歌翻译
在过程挖掘中,发现技术使从事件日志自动构建业务流程模型成为可能。但是,结果通常无法达到模型复杂性及其拟合精度之间的平衡,因此需要进行手动模型调整。该论文提出了一种方法开采的方法,该方法基于模型复杂性和适应性的组合评估为模型优化提供半自动支持。为了在两种成分之间取得平衡,提出了一种模型简化方法,该方法基本上在所需的粒度下抽象了原始模型。此外,我们介绍了一个元态的概念,该元素的周期崩溃了,该循环可以潜在地简化模型并解释模型。我们旨在使用来自医疗保健领域不同应用程序的三个数据集证明技术解决方案的功能。它们是针对COVID-19大流行期间动脉高血压和医疗保健工作人员工作流动的患者的远程监测过程。案例研究还调查了各种复杂性度量和解决方案应用方式的使用,从而提供了有关改善过程模型中改善可解释性和复杂性/适应性平衡的更好实践的见解。
translated by 谷歌翻译
在执行现实生活过程中,计划或意外的变化是常见的。检测这些更改是优化运行此类过程的组织的性能的必要条件。最先进的大多数算法都集中在突然变化的检测上,抛开其他类型的变化。在本文中,我们将专注于自动检测渐进漂移,这是一种特殊的变化类型,其中两个模型的情况在一段时间内重叠。所提出的算法依赖于一致性检查指标来自动检测变化,还将这些变化的全自动分类为突然或逐渐分类。该方法已通过一个由120个日志组成的合成数据集进行了验证,该数据集具有不同的变化分布,在检测和分类准确性,延迟和变化区域在比较主要的最新算法方面取得更好的结果。
translated by 谷歌翻译
最先进的过程发现方法从事件日志构建自由选择流程模型。因此,构造的模型不会考虑事件之间的间接依赖关系。每当输入行为不是自由选择时,这些方法都无法提供精确的模型。在本文中,我们提出了一种通过添加非自由选择构造通过基于地区的技术发现的非自由选择构造来增强自由选择工艺模型的新方法。这使我们能够从现有的过程发现方法的性能中受益以及采用基本合成技术的准确性。我们证明,当存在间接依赖关系时,所提出的方法在提高了事件日志时保留了适应性。该方法已经在合成和实际数据集中实施和测试。结果表明其在从事件日志中修复模型的有效性。
translated by 谷歌翻译
可靠的剩余时间预测正在进行的业务流程是一个高度相关的主题。一个例子是订单交付,这是一个关键的竞争因素,例如零售是因为它是客户满意度的主要驱动力。为了及时实现及时的交付,对交付过程剩余时间的准确预测至关重要。在过程挖掘领域内,已经提出了各种各样的剩余时间预测技术。在这项工作中,我们基于随机培养皿网的剩余时间预测,该预测通常分布在k-nearthiend邻居中。 k-nearest邻居算法是在存储过去的时间以完成先前活动的时间的简单矢量上执行的。通过仅采用一部分实例,获得了更具代表性和稳定的随机培养皿网,从而导致更准确的时间预测。我们讨论了该技术及其在Python中的基本实现,并使用不同的现实世界数据集来评估我们扩展的预测能力。这些实验在结合有关预测能力方面的两种技术方面都具有明显的优势。
translated by 谷歌翻译
业务流程模拟(BPS)是估计变更对业务流程对其绩效指标的影响的常见方法。例如,BPS允许我们估算如果我们自动化其活动之一的过程的周期时间。 BPS的起点是用仿真参数(BPS模型)注释的业务过程模型。几项研究提出了通过过程挖掘自动从事件日志发现BPS模型的方法。但是,该空间中的当前技术发现了BPS模型,该模型仅捕获由资源争夺或资源不可用而引起的等待时间。通常,业务流程中等待时间的相当一部分是由无关紧要的延误引起的,例如资源等待客户返回电话。本文提出了一种发现从输入数据中发现无关的延迟的方法,并将计时器事件注入BPS模型以捕获发现的延迟。涉及合成和现实生活日志的经验评估表明,该方法会产生BPS模型,以更好地反映该过程的时间动力学,相对于未捕获无关紧要的延迟的BPS模型。
translated by 谷歌翻译
对业务流程的预测监控是流程挖掘的子领域,旨在预测下一个事件的特征或下一个事件的序列。虽然已经提出了基于深度学习的多种方法,主要是经常发生的神经网络和卷积神经网络,但它们都不是真正利用过程模型中可用的结构信息。本文提出了一种基于图形卷积网络和经常性神经网络的方法,所述内部网络从过程模型中使用信息。真实事件日志的实验评估表明,我们的方法更加一致,更优于当前的最先进的方法。
translated by 谷歌翻译
一致性检查是一种过程挖掘技术,允许验证过程实例与给定模型的符合性。因此,该技术被预定在医学环境中用于将治疗案例与临床准则进行比较。但是,医学过程是高度可变,高度动态和复杂的。这使得难以在医疗领域中使用命令性一致性检查方法。研究表明,声明性方法可以更好地解决这些特征。但是,这些方法尚未获得实际接受。另一个挑战是对齐,通常不会从医学角度增加任何价值。因此,我们在案例研究中调查了HL7标准Arden语法对于宣言性,基于规则的符合度检查和使用手动建模的对齐方式的可用性。使用该方法,可以检查治疗案例的一致性,并为医疗指南的大部分地区创建有意义的对齐方式。
translated by 谷歌翻译
为了确定性能问题的原因或预测过程行为,必须具有正确和完整的事件数据至关重要。这对于具有共享资源的分布式系统尤其重要,例如,例如,一个案例可以阻止对同一台机器竞争的另一个案例,从而导致性能的帧间依赖性。然而,由于各种原因,现实系统通常只记录所有事件的子集。要了解和分析共享资源的进程的行为和性能,我们的目标是重建必须发生的情况的事件时间戳的界限,但在系统中的其他情况下未推断出现引人注目。我们通过系统地在事件日志和流程模型中系统地引入多实体概念来制定和解决问题。我们介绍了一种基于多实体事件日志的部分级模型和用于多实体进程的相应组合模型。我们将PQR-Systems定义为具有共享资源和队列的特殊类多实体进程。然后,我们研究了从一个不完整的事件日志未观察的事件和它们的时间戳推断出与PQR系统一致的时间戳。通过根据PQR模型重建未观察的资源和队列来解决问题,并使用线性程序导出其时间戳的界限。虽然在机场的行李处理系统如行李处理系统中的材料处理系统说明了问题,但该方法可以应用于录制不完整的其他设置。这些想法已在PROM中实现,并使用合成和实际事件日志进行评估。
translated by 谷歌翻译
流程挖掘的学科在医疗保健领域成功应用程序具有可靠的记录。在这样的研究领域,我们进行了与德国Uniklinik Aachen医院重症监护病房(ICU)病房有关的案例研究。这项工作的目的是双重的:开发一个规范模型,该模型代表了COVID-19患者治疗的临床指南,并分析观察到的行为(记录在医院的信息系统中)对此类准则的依从性。我们表明,通过一致性检查技术,可以分析COVID-19患者的护理过程,并强调与临床准则的主要偏差。结果为医生提供了改善过程并确保服务质量和患者满意度的有用指示。我们将结果模型作为开源BPMN文件共享。
translated by 谷歌翻译
Prescriptive Process Monitoring systems recommend, during the execution of a business process, interventions that, if followed, prevent a negative outcome of the process. Such interventions have to be reliable, that is, they have to guarantee the achievement of the desired outcome or performance, and they have to be flexible, that is, they have to avoid overturning the normal process execution or forcing the execution of a given activity. Most of the existing Prescriptive Process Monitoring solutions, however, while performing well in terms of recommendation reliability, provide the users with very specific (sequences of) activities that have to be executed without caring about the feasibility of these recommendations. In order to face this issue, we propose a new Outcome-Oriented Prescriptive Process Monitoring system recommending temporal relations between activities that have to be guaranteed during the process execution in order to achieve a desired outcome. This softens the mandatory execution of an activity at a given point in time, thus leaving more freedom to the user in deciding the interventions to put in place. Our approach defines these temporal relations with Linear Temporal Logic over finite traces patterns that are used as features to describe the historical process data recorded in an event log by the information systems supporting the execution of the process. Such encoded log is used to train a Machine Learning classifier to learn a mapping between the temporal patterns and the outcome of a process execution. The classifier is then queried at runtime to return as recommendations the most salient temporal patterns to be satisfied to maximize the likelihood of a certain outcome for an input ongoing process execution. The proposed system is assessed using a pool of 22 real-life event logs that have already been used as a benchmark in the Process Mining community.
translated by 谷歌翻译
迄今为止,业务流程监测方法主要集中在监控单个过程模型的情况下监控进程的执行。但是,在某些情况下,有必要同时考虑多个过程规范。此外,这些规范可以是程序,声明性或两者的组合。例如,在医学结构域中,描述特定疾病治疗的临床指南不能考虑任何可以对特定患者共存的所有可能的共同因素,因此可能需要考虑额外的约束。在某些情况下,这些限制可能与临床指南不相容,因此要求违反指导方针或限制。在本文中,我们提出了一种监测混合过程规范的相互作用的解决方案,表示为(数据感知)Petri网和时间逻辑规则的组合。在流程执行期间,如果这些规范彼此冲突,则可以违反其中一些。监控系统配备了违规成本模型,系统可以以避免可能违规或最小化违规成本的方式推荐下一步行动。
translated by 谷歌翻译
概念漂移过程挖掘(PM)是一种挑战,因为古典方法假设进程处于稳态,即事件共享相同的进程版本。我们对这些领域的交叉点进行了系统的文献综述,从而审查了过程采矿中的概念漂移,并提出了用于漂移检测和在线流程挖掘的现有技术的分类,以实现不断发展的环境。现有的作品描绘了(i)PM仍然主要关注离线分析,并且(ii)由于缺乏公共评估协议,数据集和指标,过程中的概念漂移技术的评估是麻烦的。
translated by 谷歌翻译
预测过程分析已成为组织的基本援助,从而为其流程提供在线运营支持。但是,需要向流程利益相关者提供解释为什么预测给定流程执行以某种方式行事的原因。否则,他们将不太可能相信预测性监测技术,从而采用它。本文提出了一个预测分析框架,该框架还具有基于Shapley值的游戏理论的解释功能。该框架已在IBM Process采矿套件中实施,并为业务用户商业化。该框架已在现实生活事件数据上进行了测试,以评估预测的质量和相应的评估。特别是,已经执行了用户评估,以了解系统提供的解释是否可以使流程利益相关者可理解。
translated by 谷歌翻译
复杂的事件识别(CER)系统在过去二十年中变得流行,因为它们能够“立即”检测在实时事件流上的模式。然而,缺乏预测模式可能发生在例如由Cer发动机实际检测到这种发生之前的模式。我们提出了一项正式的框架,试图解决复杂事件预测(CEF)的问题。我们的框架结合了两个形式主义:a)用于编码复杂事件模式的符号自动机; b)预测后缀树,可以提供自动机构的行为的简洁概率描述。我们比较我们提出的方法,以防止最先进的方法,并在准确性和效率方面展示其优势。特别地,预测后缀树是可变的马尔可夫模型,可以通过仅记住足够的信息的过去序列来捕获流中的长期依赖性。我们的实验结果表明了能够捕获这种长期依赖性的准确性的益处。这是通过增加我们模型的顺序来实现的,以满足需要执行给定顺序的所有可能的过去序列的所有可能的过去序列的详尽枚举的全阶马尔可夫模型。我们还广泛讨论CEF解决方案如何最佳地评估其预测的质量。
translated by 谷歌翻译
Various methods using machine and deep learning have been proposed to tackle different tasks in predictive process monitoring, forecasting for an ongoing case e.g. the most likely next event or suffix, its remaining time, or an outcome-related variable. Recurrent neural networks (RNNs), and more specifically long short-term memory nets (LSTMs), stand out in terms of popularity. In this work, we investigate the capabilities of such an LSTM to actually learn the underlying process model structure of an event log. We introduce an evaluation framework that combines variant-based resampling and custom metrics for fitness, precision and generalization. We evaluate 4 hypotheses concerning the learning capabilities of LSTMs, the effect of overfitting countermeasures, the level of incompleteness in the training set and the level of parallelism in the underlying process model. We confirm that LSTMs can struggle to learn process model structure, even with simplistic process data and in a very lenient setup. Taking the correct anti-overfitting measures can alleviate the problem. However, these measures did not present themselves to be optimal when selecting hyperparameters purely on predicting accuracy. We also found that decreasing the amount of information seen by the LSTM during training, causes a sharp drop in generalization and precision scores. In our experiments, we could not identify a relationship between the extent of parallelism in the model and the generalization capability, but they do indicate that the process' complexity might have impact.
translated by 谷歌翻译
过去十年来,基于传感器数据,人们对人类活动识别的兴趣增加了。最常见的是,传感器数据未被注释,从而需要快速标记方法。为了评估标签的质量,必须选择适当的性能指标。我们的主要贡献是一种新型的活动后处理方法。它通过在估计中纠正不切实际的简短活动来提高分类方法的准确性。我们还提出了一项新的绩效指标,即当地时移度(LTS措施),该措施解决了状态变化时期的不确定性。使用新型LTS测量,根据模拟数据集和足球传感器数据的真实应用,使用新的LTS测量评估了后处理方法的有效性。模拟研究还用于讨论后处理方法和LTS测量的参数的选择。
translated by 谷歌翻译
业务流程的自动化和数字化导致信息系统中捕获的大量数据,这可以帮助企业更好地理解其流程,改善工作流或提供运营支持。通过对正在进行的过程进行预测,可以识别瓶颈并重新分配资源,以及在过程实例的状态(案例)中获得的见解。传统上,数据是以带有单个识别案例概念的事件日志的形式从系统中提取的,例如用于现金订单(O2C)流程的订单ID。但是,实际过程通常具有多种对象类型,例如订单,项目和软件包,因此强制使用单个案例概念的格式不会反映数据中的基本关系。引入了以对象为中心的事件日志(OCEL)格式,以正确捕获此信息。最先进的预测方法仅根据传统事件日志量身定制。该论点表明,可以使用OCEL中包含的丰富数据来增强一种利用生成对抗网络(GAN),长期记忆(LSTM)体系结构(SEQ2SEQ)的预测方法。 OCEL中的对象可以具有可用于预测下一个事件和时间戳的属性,例如对于对象类型包的优先类属性,指示速度较慢或更快地处理。在预测剩余事件的序列相似性和时间戳的平均绝对误差(MAE)的指标中,本文中的方法匹配或超过了先前的研究,具体取决于所选对象属性是否是模型的有用特征。此外,本文提供了一个Web界面,以预测用户输入中的下一个活动序列。
translated by 谷歌翻译