智能论文笔记

Alexa, Predict My Flight Delay

Sia Gholami , Saba Khashe

分类：机器学习

2022-08-21

航空公司今天对于及时运送人和商品至关重要。这些飞机时间表的任何延误都可能在任何给定时间可能破坏数千名员工的业务和交易。因此，精确的飞行延迟预测对航空业和乘客旅行是有益的。最近的研究重点是使用人工智能算法来预测飞行延迟的可能性。较早的预测算法是为特定航空路线或机场设计的。许多目前的飞行延迟预测算法依赖于微小的样本，并且具有挑战性地理解，几乎没有用于机器学习实施的空间。这项研究通过分析美利坚合众国国内航班的数据来开发飞行延迟预测系统。拟议的模型了解导致飞行延迟和取消的因素以及出发与到达延迟之间的联系。

translated by 谷歌翻译

A Dependable Hybrid Machine Learning Model for Network Intrusion Detection

Md. Alamin Talukder , Khondokar Fida Hasan , Md. Manowarul Islam , Md Ashraf Uddin , Arnisha Akhter , Mohammand Abu Yousuf , Fares Alharbi , Mohammad Ali Moni

分类：机器学习

2022-12-08

Network intrusion detection systems (NIDSs) play an important role in computer network security. There are several detection mechanisms where anomaly-based automated detection outperforms others significantly. Amid the sophistication and growing number of attacks, dealing with large amounts of data is a recognized issue in the development of anomaly-based NIDS. However, do current models meet the needs of today's networks in terms of required accuracy and dependability? In this research, we propose a new hybrid model that combines machine learning and deep learning to increase detection rates while securing dependability. Our proposed method ensures efficient pre-processing by combining SMOTE for data balancing and XGBoost for feature selection. We compared our developed method to various machine learning and deep learning algorithms to find a more efficient algorithm to implement in the pipeline. Furthermore, we chose the most effective model for network intrusion based on a set of benchmarked performance analysis criteria. Our method produces excellent results when tested on two datasets, KDDCUP'99 and CIC-MalMem-2022, with an accuracy of 99.99% and 100% for KDDCUP'99 and CIC-MalMem-2022, respectively, and no overfitting or Type-1 and Type-2 issues.

translated by 谷歌翻译

Artificial Intelligence and Design of Experiments for Assessing Security of Electricity Supply: A Review and Strategic Outlook

Jan Priesmann , Justin Münch , Elias Ridha , Thomas Spiegel , Marius Reich , Mario Adam , Lars Nolting , Aaron Praktiknjo

分类：人工智能

2021-12-07

评估能源转型和能源市场自由化对资源充足性的影响是一种越来越重要和苛刻的任务。能量系统的上升复杂性需要足够的能量系统建模方法，从而提高计算要求。此外，随着复杂性，同样调用概率评估和场景分析同样增加不确定性。为了充分和高效地解决这些各种要求，需要来自数据科学领域的新方法来加速当前方法。通过我们的系统文献综述，我们希望缩小三个学科之间的差距（1）电力供应安全性评估，（2）人工智能和（3）实验设计。为此，我们对所选应用领域进行大规模的定量审查，并制作彼此不同学科的合成。在其他发现之外，我们使用基于AI的方法和应用程序的AI方法和应用来确定电力供应模型的复杂安全性的元素，并作为未充分涵盖的应用领域的储存调度和（非）可用性。我们结束了推出了一种新的方法管道，以便在评估电力供应安全评估时充分有效地解决当前和即将到来的挑战。

translated by 谷歌翻译

Common human diseases prediction using machine learning based on survey data

Jabir Al Nahian , Abu Kaisar Mohammad Masum , Sheikh Abujar , Md. Jueal Mia

分类：机器学习

2022-09-22

在这个时代，作为医疗的主要重点，这一时刻已经到来了。尽管令人印象深刻，但已经开发出来检测疾病的多种技术。此时，有一些类型的疾病COVID-19，正常烟，偏头痛，肺病，心脏病，肾脏疾病，糖尿病，胃病，胃病，胃病，骨骼疾病，自闭症是非常常见的疾病。在此分析中，我们根据疾病的症状进行了分析疾病症状的预测。我们研究了一系列症状，并接受了人们的调查以完成任务。已经采用了几种分类算法来训练模型。此外，使用性能评估矩阵来衡量模型的性能。最后，我们发现零件分类器超过了其他分类器。

translated by 谷歌翻译

IoT Data Analytics in Dynamic Environments: From An Automated Machine Learning Perspective

Li Yang , Abdallah Shami

分类：机器学习

2022-09-16

近年来，随着传感器和智能设备的广泛传播，物联网（IoT）系统的数据生成速度已大大增加。在物联网系统中，必须经常处理，转换和分析大量数据，以实现各种物联网服务和功能。机器学习（ML）方法已显示出其物联网数据分析的能力。但是，将ML模型应用于物联网数据分析任务仍然面临许多困难和挑战，特别是有效的模型选择，设计/调整和更新，这给经验丰富的数据科学家带来了巨大的需求。此外，物联网数据的动态性质可能引入概念漂移问题，从而导致模型性能降解。为了减少人类的努力，自动化机器学习（AUTOML）已成为一个流行的领域，旨在自动选择，构建，调整和更新机器学习模型，以在指定任务上实现最佳性能。在本文中，我们对Automl区域中模型选择，调整和更新过程中的现有方法进行了审查，以识别和总结将ML算法应用于IoT数据分析的每个步骤的最佳解决方案。为了证明我们的发现并帮助工业用户和研究人员更好地实施汽车方法，在这项工作中提出了将汽车应用于IoT异常检测问题的案例研究。最后，我们讨论并分类了该领域的挑战和研究方向。

translated by 谷歌翻译

Predictive Modeling of Charge Levels for Battery Electric Vehicles using CNN EfficientNet and IGTD Algorithm

Seongwoo Choi , Chongzhou Fang , David Haddad , Minsung Kim

分类：计算机视觉 | 人工智能 | 机器学习

2022-06-07

卷积神经网络（CNN）是理解庞大图像数据集的好解决方案。随着配备电池电动汽车的数量增加在全球范围内蓬勃发展，已经进行了很多研究，了解了哪种电荷电力汽车驾驶员会选择为车辆充电以无需任何预防就能到达目的地。我们实施了深度学习方法来分析表格数据集，以了解其充电状态以及他们会选择哪些充电水平。此外，我们还为表格数据集算法实施了图像生成器，以利用表格数据集作为图像数据集来训练卷积神经网络。此外，我们集成了其他CNN体系结构，例如ExcilityNet，以证明CNN是从表格数据集中转换的图像中读取信息的出色学习者，并能够预测配备电池配备电池电动汽车的充电水平。我们还评估了几种优化方法，以提高模型的学习率，并检查了改进模型体系结构的进一步分析。

translated by 谷歌翻译

Machine Learning in Access Control: A Taxonomy and Survey

Mohammad Nur Nobi , Maanak Gupta , Lopamudra Praharaj , Mahmoud Abdelsalam , Ram Krishnan , Ravi Sandhu

分类：机器学习

2022-07-04

越来越多的工作已经认识到利用机器学习（ML）进步的重要性，以满足提取访问控制属性，策略挖掘，策略验证，访问决策等有效自动化的需求。在这项工作中，我们调查和总结了各种ML解决不同访问控制问题的方法。我们提出了ML模型在访问控制域中应用的新分类学。我们重点介绍当前的局限性和公开挑战，例如缺乏公共现实世界数据集，基于ML的访问控制系统的管理，了解黑盒ML模型的决策等，并列举未来的研究方向。

translated by 谷歌翻译

Towards Explainable Artificial Intelligence in Banking and Financial Services

Ambreen Hanif

分类：机器学习 | 人工智能

2021-12-14

人工智能（AI）使机器能够从人类经验中学习，适应新的输入，并执行人类的人类任务。 AI正在迅速发展，从过程自动化到认知增强任务和智能流程/数据分析的方式转换业务方式。然而，人类用户的主要挑战是理解和适当地信任AI算法和方法的结果。在本文中，为了解决这一挑战，我们研究并分析了最近在解释的人工智能（XAI）方法和工具中所做的最新工作。我们介绍了一种新颖的XAI进程，便于生产可解释的模型，同时保持高水平的学习性能。我们提出了一种基于互动的证据方法，以帮助人类用户理解和信任启用AI的算法创建的结果和输出。我们在银行域中采用典型方案进行分析客户交易。我们开发数字仪表板以促进与算法的互动结果，并讨论如何提出的XAI方法如何显着提高数据科学家对理解启用AI的算法结果的置信度。

translated by 谷歌翻译

Leak Detection in Natural Gas Pipeline Using Machine Learning Models

Adebayo Oshingbesan

分类：机器学习

2022-09-21

天然气管道中的泄漏检测是石油和天然气行业的一个重要且持续的问题。这尤其重要，因为管道是运输天然气的最常见方法。这项研究旨在研究数据驱动的智能模型使用基本操作参数检测天然气管道的小泄漏的能力，然后使用现有的性能指标比较智能模型。该项目应用观察者设计技术，使用回归分类层次模型来检测天然气管道中的泄漏，其中智能模型充当回归器，并且修改后的逻辑回归模型充当分类器。该项目使用四个星期的管道数据流研究了五个智能模型（梯度提升，决策树，随机森林，支持向量机和人工神经网络）。结果表明，虽然支持向量机和人工神经网络比其他网络更好，但由于其内部复杂性和所使用的数据量，它们并未提供最佳的泄漏检测结果。随机森林和决策树模型是最敏感的，因为它们可以在大约2小时内检测到标称流量的0.1％的泄漏。所有智能模型在测试阶段中具有高可靠性，错误警报率为零。将所有智能模型泄漏检测的平均时间与文献中的实时短暂模型进行了比较。结果表明，智能模型在泄漏检测问题中的表现相对较好。该结果表明，可以与实时瞬态模型一起使用智能模型，以显着改善泄漏检测结果。

translated by 谷歌翻译

Multi-Airport Delay Prediction with Transformers

Liya Wang , Alex Tien , Jason Chou

分类：机器学习 | 人工智能

2021-11-04

机场性能预测具有合理的展示期限是一个具有挑战性的任务，并且已经通过各种先前研究进行了尝试。交通，需求，天气和交通管理行动是任何预测模型的关键输入。本文提出了一种基于时间融合变压器（TFT）的新方法，以预测多次机场的偏离和到达延迟。这种方法可以捕获预测时已知的输入的复杂时间动态，然后预测未来4小时的选定延迟度量。在处理天气投入时，开发了一种自我监督的学习（SSL）模型以将高维天气数据编码为更低的尺寸表示，以更有效和有效地培训TFT。初始结果表明，基于TFT的延迟预测模型通过测试数据集上的较小预测误差来实现令人满意的性能。此外，模型输出的解释性分析识别延迟预测的重要输入因子。预计拟议的方法有望帮助空中交通管理人员或决策者对延误缓解的交通管理行动以及运作，提供足够的提前时间来规划预测性能下降。

translated by 谷歌翻译

Machine learning based disease diagnosis: A comprehensive review

Md Manjurul Ahsan , Zahed Siddique

分类：机器学习

2021-12-31

在全球范围内，有实质性的未满足需要有效地诊断各种疾病。不同疾病机制的复杂性和患者人群的潜在症状具有巨大挑战，以发展早期诊断工具和有效治疗。机器学习（ML），人工智能（AI）区域，使研究人员，医师和患者能够解决这些问题的一些问题。基于相关研究，本综述解释了如何使用机器学习（ML）和深度学习（DL）来帮助早期识别许多疾病。首先，使用来自Scopus和Science（WOS）数据库的数据来给予所述出版物的生物计量研究。对1216个出版物的生物计量研究进行了确定，以确定最多产的作者，国家，组织和最引用的文章。此次审查总结了基于机器学习的疾病诊断（MLBDD）的最新趋势和方法，考虑到以下因素：算法，疾病类型，数据类型，应用和评估指标。最后，该文件突出了关键结果，并向未来的未来趋势和机遇提供了解。

translated by 谷歌翻译

Decision Support Models for Predicting and Explaining Airport Passenger Connectivity from Data

Marta Guimaraes , Claudia Soares , Rodrigo Ventura

分类：机器学习

2021-11-02

预测连通航班中的乘客将失去他们的联系对于航空公司盈利能力至关重要。我们为不同阶段的连接飞行管理的不同阶段提出了新型机器学习的决策支持模型，即战略，战术，战术和后期行动。我们预测航空公司枢纽机场的错过航班连接，使用航班和乘客的历史数据，分析了对每个决策地平线的预测结果贡献的因素。我们的数据是高维，异质，不平衡和嘈杂的，并且不会通知客人抵达/离境运输时间。我们采用了分类类的概率编码，与高斯混合模型的数据平衡，以及提升。对于所有规划视野，我们的模型将ROC的AUC达到高于0.93。我们模型的Shap值说明表明计划/感知的连接时间对预测的最大贡献，其次是乘客年龄以及是否需要边界控制。

translated by 谷歌翻译

The Prominence of Artificial Intelligence in COVID-19

MD Abdullah Al Nasim , Aditi Dhali , Faria Afrin , Noshin Tasnim Zaman , Nazmul Karim

分类：机器学习 | 人工智能

2021-11-18

2019年12月，一个名为Covid-19的新型病毒导致了迄今为止的巨大因果关系。与新的冠状病毒的战斗在西班牙语流感后令人振奋和恐怖。虽然前线医生和医学研究人员在控制高度典型病毒的传播方面取得了重大进展，但技术也证明了在战斗中的重要性。此外，许多医疗应用中已采用人工智能，以诊断许多疾病，甚至陷入困境的经验丰富的医生。因此，本调查纸探讨了提议的方法，可以提前援助医生和研究人员，廉价的疾病诊断方法。大多数发展中国家难以使用传统方式进行测试，但机器和深度学习可以采用显着的方式。另一方面，对不同类型的医学图像的访问已经激励了研究人员。结果，提出了一种庞大的技术数量。本文首先详细调了人工智能域中传统方法的背景知识。在此之后，我们会收集常用的数据集及其用例日期。此外，我们还显示了采用深入学习的机器学习的研究人员的百分比。因此，我们对这种情况进行了彻底的分析。最后，在研究挑战中，我们详细阐述了Covid-19研究中面临的问题，我们解决了我们的理解，以建立一个明亮健康的环境。

translated by 谷歌翻译

Machine Unlearning: Learning, Polluting, and Unlearning for Spam Email

Nishchal Parne , Kyathi Puppaala , Nithish Bhupathi , Ripon Patgiri

分类：机器学习 | 人工智能

2021-11-26

在此上下文中研究了用于安全性的机器。存在几种垃圾邮件检测方法，每个垃圾邮件检测方法采用不同的算法来检测不期望的垃圾邮件。但这些模型容易受到攻击。许多攻击者通过以各种方式污染到模型的数据来利用模型。因此，在这种情况下，在这种情况下表现得可能需要在不需要再培训的情况下容易地解除污染数据。在大多数情况下，在大多数情况下，Retringing在过去已经训练到模型的大量数据，这需要再次训练，只需删除少量污染数据，这通常明显小于1％。通过开发所有垃圾邮件检测模型的未读框架可以解决这个问题。在本研究中，无线学习模块集成到基于天真贝叶斯，决策树和随机林算法的垃圾邮件检测模型中。为了评估未经读回的未经读取的好处，通过攻击者的职位和证明模型的漏洞，污染和利用了三种垃圾邮件检测模型。每种情况都显示了准确性和真正阳性率的降低，显示出污染对模型的影响。然后，未经读取的模块集成到模型中，并且污染数据是未解决的;在无线学习后测试模型，可以看到恢复性能。此外，对所有模型的不同污染数据尺寸进行了比较无线学习和再培训时间。在分析调查结果时，可以得出结论，无线学习与再培训相当优于。结果表明，无光，易于实施，易于实施，易于使用，有效。

translated by 谷歌翻译

Machine Learning to Predict the Antimicrobial Activity of Cold Atmospheric Plasma-Activated Liquids

Mehmet Akif Ozdemir , Gizem Dilara Ozdemir , Merve Gul , Onan Guren , Utku Kursat Ercan

分类：机器学习

2022-07-25

血浆定义为物质的第四个状态，在高电场下可以在大气压下产生非热血浆。现在众所周知，血浆激活液体（PAL）的强和广谱抗菌作用。机器学习（ML）在医疗领域的可靠适用性也鼓励其在等离子体医学领域的应用。因此，在PALS上的ML应用可以提出一种新的观点，以更好地了解各种参数对其抗菌作用的影响。在本文中，通过使用先前获得的数据来定性预测PAL的体外抗菌活性，从而介绍了比较监督的ML模型。进行了文献搜索，并从33个相关文章中收集了数据。在所需的预处理步骤之后，将两种监督的ML方法（即分类和回归）应用于数据以获得微生物灭活（MI）预测。对于分类，MI分为四类，对于回归，MI被用作连续变量。为分类和回归模型进行了两种不同的可靠交叉验证策略，以评估所提出的方法。重复分层的K折交叉验证和K折交叉验证。我们还研究了不同特征对模型的影响。结果表明，高参数优化的随机森林分类器（ORFC）和随机森林回归者（ORFR）分别比其他模型进行了分类和回归的模型更好。最后，获得ORFC的最佳测试精度为82.68％，ORFR的R2为0.75。 ML技术可能有助于更好地理解在所需的抗菌作用中具有主要作用的血浆参数。此外，此类发现可能有助于将来的血浆剂量定义。

translated by 谷歌翻译

Spatiotemporal Propagation Learning for Network-Wide Flight Delay Prediction

Yuankai Wu , Hongyu Yang , Yi Lin , Hong Liu

分类：机器学习 | 人工智能

2022-07-14

揭开多个机场之间的延迟传播机制的神秘面纱对于精确且可解释的延迟预测至关重要，这对于所有航空业利益相关者来说至关重要。主要挑战在于有效利用与延迟传播有关的时空依赖性和外源因素。但是，以前的作品仅考虑有限的时空模式，其因素很少。为了促进延迟预测的更全面的传播建模，我们提出了时空传播网络（STPN），这是一种时空可分开的图形卷积网络，在时空依赖性捕获中是新颖的。从空间关系建模的方面，我们提出了一个多画卷积模型，考虑地理位置和航空公司计划。从时间依赖性捕获的方面，我们提出了一种多头的自我发起的机制，可以端对端学习，并明确地推定延迟时间序列的多种时间依赖性。我们表明，关节空间和时间学习模型产生了Kronecker产品的总和，这是由于时空依赖性归因于几个空间和时间邻接矩阵的总和。通过这种方式，STPN允许对空间和时间因素进行串扰，以建模延迟传播。此外，将挤压和激发模块添加到STPN的每一层，以增强有意义的时空特征。为此，我们在大规模机场网络中将STPN应用于多步进和出发延迟预测。为了验证我们的模型的有效性，我们尝试了两个现实世界中的延迟数据集，包括美国和中国航班延迟；我们表明，STPN优于最先进的方法。此外，STPN产生的反事实表明，它学习了可解释的延迟传播模式。

translated by 谷歌翻译

Enhancement of Healthcare Data Transmission using the Levenberg-Marquardt Algorithm

Angela An , James Jin Kang

分类：机器学习

2022-06-09

在医疗保健系统中，需要患者使用可穿戴设备进行远程数据收集和对健康数据的实时监控以及健康状况的状态。可穿戴设备的这种采用导致收集和传输的数据量显着增加。由于设备由较小的电池电源运行，因此由于设备的高处理要求以进行数据收集和传输，因此可以快速减少它们。鉴于医疗数据的重要性，必须所有传输数据遵守严格的完整性和可用性要求。减少医疗保健数据的量和传输频率将通过使用推理算法改善设备电池寿命。有一个以准确性和效率改善传输指标的问题，彼此之间的权衡，例如提高准确性会降低效率。本文表明，机器学习可用于分析复杂的健康数据指标，例如数据传输的准确性和效率，以使用Levenberg-Marquardt算法来克服权衡问题，从而增强这两个指标，从而通过少较少的样本来传输，同时保持维护准确性。使用标准心率数据集测试该算法以比较指标。结果表明，LMA最好以3.33倍的效率进行样本数据尺寸和79.17％的精度，在7种不同的采样案例中具有相似的准确性，用于测试，但表明效率提高。与具有高效率的现有方法相比，这些提出的方法使用机器学习可以显着改善两个指标，而无需牺牲其他指标。

translated by 谷歌翻译

Experiment Based Crafting and Analyzing of Machine Learning Solutions

Samuel Ackerman , Eitan Farchi , Orna Raz , Onn Shehory

分类：机器学习

2022-01-02

基于机器学习（ML）的系统的制作需要在其生命周期中进行统计控制。仔细量化业务需求和识别影响业务需求的关键因素降低了项目故障的风险。业务需求的量化导致随机变量的定义，表示通过统计实验需要分析的系统关键性能指标。此外，可提供的培训和实验结果产生影响系统的设计。开发系统后，测试并不断监控，以确保其符合其业务需求。这是通过持续应用统计实验来分析和控制关键绩效指标来完成的。本书教授制作和开发基于ML的系统的艺术。它倡导“首先”方法，强调从项目生命周期开始定义统计实验的需要。它还详细讨论了如何在整个生命周期中对基于ML的系统进行统计控制。

translated by 谷歌翻译

Automatic Identification and Classification of Share Buybacks and their Effect on Short-, Mid- and Long-Term Returns

Thilo Reintjes

分类：人工智能 | 机器学习

2022-09-26

本文调查了股票回购，特别是分享回购公告。它解决了如何识别此类公告，股票回购的超额回报以及股票回购公告后的回报的预测。我们说明了两种NLP方法，用于自动检测股票回购公告。即使有少量的培训数据，我们也可以达到高达90％的准确性。该论文利用这些NLP方法生成一个由57,155个股票回购公告组成的大数据集。通过分析该数据集，本论文的目的是表明大多数宣布回购的公司的大多数公司都表现不佳。但是，少数公司的表现极大地超过了MSCI世界。当查看所有公司的平均值时，这种重要的表现过高会导致净收益。如果根据公司的规模调整了基准指数，则平均表现过高，并且大多数表现不佳。但是，发现宣布股票回购的公司至少占其市值的1％，即使使用调整后的基准，也平均交付了显着的表现。还发现，在危机时期宣布股票回购的公司比整个市场更好。此外，生成的数据集用于训练72个机器学习模型。通过此，它能够找到许多可以达到高达77％并产生大量超额回报的策略。可以在六个不同的时间范围内改善各种性能指标，并确定明显的表现。这是通过训练多个模型的不同任务和时间范围以及结合这些不同模型的方法来实现的，从而通过融合弱学习者来产生重大改进，以创造一个强大的学习者。

translated by 谷歌翻译

The Integration of Machine Learning into Automated Test Generation: A Systematic Literature Review

Afonso Fontes , Gregory Gay

分类：机器学习

2022-06-21

背景：机器学习（ML）可以实现有效的自动测试生成。目的：我们表征了新兴研究，检查测试实践，研究人员目标，应用的ML技术，评估和挑战。方法：我们对97个出版物的样本进行系统文献综述。结果：ML生成系统，GUI，单位，性能和组合测试的输入或改善现有生成方法的性能。 ML还用于生成测试判决，基于属性的和预期的输出序列。经常基于神经网络和强化学习的监督学习通常是基于Q学习的 - 很普遍，并且某些出版物还采用了无监督或半监督的学习。使用传统的测试指标和与ML相关的指标（例如准确性）评估（半/非 - ）监督方法，而经常使用与奖励功能相关的测试指标来评估强化学习。结论：工作到尽头表现出巨大的希望，但是在培训数据，再探术，可伸缩性，评估复杂性，所采用的ML算法以及如何应用 - 基准和可复制性方面存在公开挑战。我们的发现可以作为该领域研究人员的路线图和灵感。

translated by 谷歌翻译