智能论文笔记

Examining stability of machine learning methods for predicting dementia at early phases of the disease

Sinan Faouri , Mahmood AlBashayreh , Mohammad Azzeh

分类：机器学习 | 人工智能

2022-09-10

痴呆症是一种神经精神脑障碍，通常会在一个或多个脑细胞停止部分或根本停止工作时发生。在疾病的早期阶段诊断这种疾病是从不良后果中挽救生命并为他们提供更好的医疗保健的至关重要的任务。事实证明，机器学习方法在预测疾病早期痴呆症方面是准确的。痴呆的预测在很大程度上取决于通常从归一化的全脑体积（NWBV）和地图集缩放系数（ASF）收集的收集数据类型，这些数据通常测量并从磁共振成像（MRIS）中进行校正。年龄和性别等其他生物学特征也可以帮助诊断痴呆症。尽管许多研究使用机器学习来预测痴呆症，但我们无法就这些方法的稳定性得出结论，而这些方法在不同的实验条件下更准确。因此，本文研究了有关痴呆预测的机器学习算法的性能的结论稳定性。为此，使用7种机器学习算法和两种功能还原算法，即信息增益（IG）和主成分分析（PCA）进行大量实验。为了检查这些算法的稳定性，IG的特征选择阈值从20％更改为100％，PCA尺寸从2到8。这导致了7x9 + 7x7 = 112实验。在每个实验中，都记录了各种分类评估数据。获得的结果表明，在七种算法中，支持向量机和天真的贝叶斯是最稳定的算法，同时更改选择阈值。同样，发现使用IG似乎比使用PCA预测痴呆症更有效。

translated by 谷歌翻译

An Interactive Automation for Human Biliary Tree Diagnosis Using Computer Vision

Mohammad AL-Oudat , Saleh Alomari , Hazem Qattous , Mohammad Azzeh , Tariq AL-Munaizel

分类：计算机视觉 | 机器学习

2022-09-10

胆道是一个管网络，将肝脏与胆囊连接到胆囊，这是一个正下方的器官。胆管是胆汁树中的主要管。胆管的扩张是人体中更多主要问题的关键指标，例如石头和肿瘤，这些问题通常是由胰腺或Vater的乳头状引起的。在许多情况下，胆管扩张的检测对于初学者或未经训练的医务人员来说可能具有挑战性。即使是专业人士也无法用肉眼检测到胆管扩张。这项研究提出了一种基于视觉的独特模型，用于初始诊断。为了从磁共振图像分割胆道树，框架使用了不同的图像处理方法（MRI）。在对图像的感兴趣区域进行了细分后，对其进行了许多计算，以提取10个特征，包括主要轴和次要轴，胆管区域，胆汁树面积，紧凑性和某些纹理特征（对比度，平均值，方差和相关性）。这项研究使用了约旦安曼国王侯赛因医学中心的图像数据库，其中包括200张MRI图像，100例正常病例和100例胆管扩张的患者。提取特征后，使用各种分类器来确定患者的健康状况（正常或扩张）。研究结果表明，提取的特征在曲线下的准确性和面积方面与所有分类器都很好。这项研究的独特之处在于，它使用自动方法从MRI图像中分割胆汁树，并且科学地将检索到的特征与胆道树状态相关联，而文献中从未做过。

translated by 谷歌翻译

Machine Learning and Ensemble Approach Onto Predicting Heart Disease

Aaditya Surya

分类：机器学习 | 人工智能

2021-11-16

一个躺在胸腔里的心脏的四个基本腔腔对一个人的生存至关重要，但讽刺地证明是最脆弱的。心血管疾病（CVD）也通常被称为心脏病，在过去几十年中，人类在人类死亡原因中稳步发展。考虑到这一点统计，很明显，患有CVDS的患者需要快速且正确的诊断，以便于早期治疗来减少死亡的机会。本文试图利用提供的数据，以培训分类模型，如逻辑回归，k最近邻居，支持向量机，决策树，高斯天真贝叶斯，随机森林和多层感知（人工神经网络），最终使用柔软投票合奏技术，以便尽可能多地诊断。

translated by 谷歌翻译

ANOVA-based Automatic Attribute Selection and a Predictive Model for Heart Disease Prognosis

Mohammed Nowshad Ruhani Chowdhury , Wandong Zhang , Thangarajah Akilan

分类：机器学习

2022-07-30

研究表明，心血管疾病（CVD）对人类健康是恶性的研究。因此，重要的是具有有效的CVD预后方法。为此，医疗保健行业采用了基于机器学习的智能解决方案，以减轻CVD预后的手动过程。因此，这项工作提出了一种信息融合技术，该技术通过分析方差（ANOVA）和域专家的知识结合了人的关键属性。它还引入了新的CVD数据样本集，用于新兴研究。进行了三十八个实验，以验证四个公开可用基准数据集中提出的框架的性能以及在这项工作中新创建的数据集。消融研究表明，所提出的方法可以达到竞争平均平均准确性（MAA）为99.2％，平均AUC平均AUC为97.9％。

translated by 谷歌翻译

Lightweight 3D Convolutional Neural Network for Schizophrenia diagnosis using MRI Images and Ensemble Bagging Classifier

P Supriya Patro , Tripti Goel , S A VaraPrasad , M Tanveer , R Murugan

分类：计算机视觉 | 机器学习

2022-11-05

Structural alterations have been thoroughly investigated in the brain during the early onset of schizophrenia (SCZ) with the development of neuroimaging methods. The objective of the paper is an efficient classification of SCZ in 2 different classes: Cognitive Normal (CN), and SCZ using magnetic resonance imaging (MRI) images. This paper proposed a lightweight 3D convolutional neural network (CNN) based framework for SCZ diagnosis using MRI images. In the proposed model, lightweight 3D CNN is used to extract both spatial and spectral features simultaneously from 3D volume MRI scans, and classification is done using an ensemble bagging classifier. Ensemble bagging classifier contributes to preventing overfitting, reduces variance, and improves the model's accuracy. The proposed algorithm is tested on datasets taken from three benchmark databases available as open-source: MCICShare, COBRE, and fBRINPhase-II. These datasets have undergone preprocessing steps to register all the MRI images to the standard template and reduce the artifacts. The model achieves the highest accuracy 92.22%, sensitivity 94.44%, specificity 90%, precision 90.43%, recall 94.44%, F1-score 92.39% and G-mean 92.19% as compared to the current state-of-the-art techniques. The performance metrics evidenced the use of this model to assist the clinicians for automatic accurate diagnosis of SCZ.

translated by 谷歌翻译

Machine learning based disease diagnosis: A comprehensive review

Md Manjurul Ahsan , Zahed Siddique

分类：机器学习

2021-12-31

在全球范围内，有实质性的未满足需要有效地诊断各种疾病。不同疾病机制的复杂性和患者人群的潜在症状具有巨大挑战，以发展早期诊断工具和有效治疗。机器学习（ML），人工智能（AI）区域，使研究人员，医师和患者能够解决这些问题的一些问题。基于相关研究，本综述解释了如何使用机器学习（ML）和深度学习（DL）来帮助早期识别许多疾病。首先，使用来自Scopus和Science（WOS）数据库的数据来给予所述出版物的生物计量研究。对1216个出版物的生物计量研究进行了确定，以确定最多产的作者，国家，组织和最引用的文章。此次审查总结了基于机器学习的疾病诊断（MLBDD）的最新趋势和方法，考虑到以下因素：算法，疾病类型，数据类型，应用和评估指标。最后，该文件突出了关键结果，并向未来的未来趋势和机遇提供了解。

translated by 谷歌翻译

Analyzing the impact of feature selection on the accuracy of heart disease prediction

Muhammad Salman Pathan , Avishek Nag , Muhammad Mohisn Pathan , Soumyabrata Dev

分类：机器学习

2022-06-07

心脏病已成为对人类生活产生重大影响的最严重疾病之一。在过去的十年中，它已成为全球人民死亡的主要原因之一。为了防止患者进一步损害，准确地诊断为心脏病是一个重要因素。最近，我们看到了非侵入性医学程序的用法，例如医学领域的基于人工智能的技术。专门的机器学习采用了多种算法和技术，这些算法和技术被广泛使用，并且在较少的时间以诊断心脏病的准确诊断非常有用。但是，对心脏病的预测并不是一件容易的事。医疗数据集的规模不断增加，使从业者了解复杂的特征关系并做出疾病预测是一项复杂的任务。因此，这项研究的目的是从高度维数据集中确定最重要的风险因素，这有助于对心脏病的准确分类，并减少并发症。为了进行更广泛的分析，我们使用了具有各种医学特征的两个心脏病数据集。基准模型的分类结果证明，相关特征对分类精度产生了很大的影响。即使功能减少，与在全功能集中训练的模型相比，分类模型的性能随着训练时间的减少而显着提高。

translated by 谷歌翻译

Comparative study of machine learning and deep learning methods on ASD classification

Ramchandra Rimal , Mitchell Brannon , Yingxin Wang

分类：机器学习 | (统计)机器学习

2022-09-18

研究了自闭症数据集，以确定自闭症和健康组之间的差异。为此，分析了这两组的静止状态功能磁共振成像（RS-FMRI）数据，并创建了大脑区域之间的连接网络。开发了几个分类框架，以区分组之间的连接模式。比较了统计推断和精度的最佳模型，并分析了精度和模型解释性之间的权衡。最后，据报道，分类精度措施证明了我们框架的性能。我们的最佳模型可以以71％的精度将自闭症和健康的患者分类为多站点I数据。

translated by 谷歌翻译

Machine Learning Approaches to Predict Breast Cancer: Bangladesh Perspective

Taminul Islam , Arindom Kundu , Nazmul Islam Khan , Choyon Chandra Bonik , Flora Akter , Md Jihadul Islam

分类：机器学习

2022-06-30

如今，乳腺癌已成为近年来最突出的死亡原因之一。在所有恶性肿瘤中，这是全球妇女最常见和主要的死亡原因。手动诊断这种疾病需要大量的时间和专业知识。乳腺癌的检测是耗时的，并且可以通过开发基于机器的乳腺癌预测来减少疾病的传播。在机器学习中，系统可以从先前的实例中学习，并使用各种统计，概率和优化方法从嘈杂或复杂的数据集中找到难以检测的模式。这项工作比较了几种机器学习算法的分类准确性，精度，灵敏度和新近收集的数据集的特异性。在这种工作决策树，随机森林，逻辑回归，天真的贝叶斯和XGBoost中，已经实施了这五种机器学习方法，以在我们的数据集中获得最佳性能。这项研究的重点是找到最佳的算法，该算法可以预测乳腺癌，以最高的准确性。这项工作在效率和有效性方面评估了每种算法数据分类的质量。并与该领域的其他已发表工作相比。实施模型后，本研究达到了最佳模型准确性，在随机森林和XGBoost上达到94％。

translated by 谷歌翻译

Common human diseases prediction using machine learning based on survey data

Jabir Al Nahian , Abu Kaisar Mohammad Masum , Sheikh Abujar , Md. Jueal Mia

分类：机器学习

2022-09-22

在这个时代，作为医疗的主要重点，这一时刻已经到来了。尽管令人印象深刻，但已经开发出来检测疾病的多种技术。此时，有一些类型的疾病COVID-19，正常烟，偏头痛，肺病，心脏病，肾脏疾病，糖尿病，胃病，胃病，胃病，骨骼疾病，自闭症是非常常见的疾病。在此分析中，我们根据疾病的症状进行了分析疾病症状的预测。我们研究了一系列症状，并接受了人们的调查以完成任务。已经采用了几种分类算法来训练模型。此外，使用性能评估矩阵来衡量模型的性能。最后，我们发现零件分类器超过了其他分类器。

translated by 谷歌翻译

BIO-CXRNET: A Robust Multimodal Stacking Machine Learning Technique for Mortality Risk Prediction of COVID-19 Patients using Chest X-Ray Images and Clinical Data

Tawsifur Rahman , Muhammad E. H. Chowdhury , Amith Khandakar , Zaid Bin Mahbub , Md Sakib Abrar Hossain , Abraham Alhatou , Eynas Abdalla , Sreekumar Muthiyal , Khandaker Farzana Islam , Saad Bin Abul Kashem

分类：计算机视觉 | 机器学习

2022-06-15

快速准确地检测该疾病可以大大帮助减少任何国家医疗机构对任何大流行期间死亡率降低死亡率的压力。这项工作的目的是使用新型的机器学习框架创建多模式系统，该框架同时使用胸部X射线（CXR）图像和临床数据来预测COVID-19患者的严重程度。此外，该研究还提出了一种基于nom图的评分技术，用于预测高危患者死亡的可能性。这项研究使用了25种生物标志物和CXR图像，以预测意大利第一波Covid-19（3月至6月2020年3月至6月）在930名Covid-19患者中的风险。提出的多模式堆叠技术分别产生了89.03％，90.44％和89.03％的精度，灵敏度和F1分数，以识别低风险或高危患者。与CXR图像或临床数据相比，这种多模式方法可提高准确性6％。最后，使用多元逻辑回归的列线图评分系统 - 用于对第一阶段确定的高风险患者的死亡风险进行分层。使用随机森林特征选择模型将乳酸脱氢酶（LDH），O2百分比，白细胞（WBC）计数，年龄和C反应蛋白（CRP）鉴定为有用的预测指标。开发了五个预测因素参数和基于CXR图像的列函数评分，以量化死亡的概率并将其分为两个风险组：分别存活（<50％）和死亡（> = 50％）。多模式技术能够预测F1评分为92.88％的高危患者的死亡概率。开发和验证队列曲线下的面积分别为0.981和0.939。

translated by 谷歌翻译

Curvature-based Feature Selection with Application in Classifying Electronic Health Records

Zheming Zuo , Jie Li , Han Xu , Noura Al Moubayed

分类：机器学习 | 人工智能

2021-01-10

颠覆性技术提供无与伦比的机会，为普遍存在医疗保健的许多方面的标识，从通过内容到机器学习（ML）技术来促进普及医疗保健的识别。作为一个强大的工具，ML已被广泛应用于以患者为中心的医疗保健解决方案。为了进一步提高患者护理的质量，在医疗保健设施中通常采用电子健康记录（EHRS）进行分析。由于它们高度非结构化，不平衡，不完整和高维性质，应用AI和ML将AI和ML应用AI和ML分析那些EHRS的重要任务。减少维度是一种常见的数据预处理技术，用于应对高维EHR数据，旨在减少EHR表示的特征的数量，同时提高随后的数据分析的性能，例如，分类。在这项工作中，提出了一种高效的基于滤波器的特征选择方法，即基于曲率的特征选择（CFS）。所提出的CFS应用了Menger曲率的概念，以对给定数据集中的所有功能的重量进行排名。已经在四种众所周知的EHR数据集中评估了所提出的CFS的性能，包括宫颈癌危险因素（CCRFD），乳腺癌助生（BCCDS），乳腺组织（BTDS）和糖尿病视网膜病变（DRDDD）。实验结果表明，所提出的CFS在上述数据集上实现了最先进的性能，而不是传统的PCA和其他最新方法。所提出的方法的源代码在https://github.com/zhemingzuo/cfs上公开提供。

translated by 谷歌翻译

A Dependable Hybrid Machine Learning Model for Network Intrusion Detection

Md. Alamin Talukder , Khondokar Fida Hasan , Md. Manowarul Islam , Md Ashraf Uddin , Arnisha Akhter , Mohammand Abu Yousuf , Fares Alharbi , Mohammad Ali Moni

分类：机器学习

2022-12-08

Network intrusion detection systems (NIDSs) play an important role in computer network security. There are several detection mechanisms where anomaly-based automated detection outperforms others significantly. Amid the sophistication and growing number of attacks, dealing with large amounts of data is a recognized issue in the development of anomaly-based NIDS. However, do current models meet the needs of today's networks in terms of required accuracy and dependability? In this research, we propose a new hybrid model that combines machine learning and deep learning to increase detection rates while securing dependability. Our proposed method ensures efficient pre-processing by combining SMOTE for data balancing and XGBoost for feature selection. We compared our developed method to various machine learning and deep learning algorithms to find a more efficient algorithm to implement in the pipeline. Furthermore, we chose the most effective model for network intrusion based on a set of benchmarked performance analysis criteria. Our method produces excellent results when tested on two datasets, KDDCUP'99 and CIC-MalMem-2022, with an accuracy of 99.99% and 100% for KDDCUP'99 and CIC-MalMem-2022, respectively, and no overfitting or Type-1 and Type-2 issues.

translated by 谷歌翻译

On Effectively Predicting Autism Spectrum Disorder Using an Ensemble of Classifiers

Bhekisipho Twala , Eamon Molloy

分类：机器学习

2022-09-02

分类器的合奏结合了几个单个分类器，以提供最终的预测或分类决策。一个越来越令人发指的问题是，此类系统是否可以胜过单个最佳分类器。如果是这样，哪种形式的分类器合奏（也称为多个分类器学习系统或多个分类器）在合奏本身的规模或多样性中产生最重要的好处？鉴于用于检测自闭症特征的测试是耗时且昂贵的，因此开发了一种将提供最佳结果和测量自闭症谱系障碍（ASD）的系统。在本文中，评估了几个单一和后来的多个分类器学习系统，以预测和确定影响或有助于ASD的因素出于早期筛查目的的能力。行为数据和机器人增强疗法的3,000次课程和300小时的数据集，该疗法被记录为61名儿童。仿真结果表明，与单个分类器相比，多个分类器学习系统（尤其是每个集合具有三个分类器的人）的优越预测性能，可以通过装袋和增强获得出色的结果。看来，社会交流手势仍然是儿童ASD问题的关键因素。

translated by 谷歌翻译

Machine Learning-Based Classification Algorithms for the Prediction of Coronary Heart Diseases

Kelvin Kwakye , Emmanuel Dadzie

分类：计算机视觉 | 机器学习

2021-12-02

冠心病，是一种心血管疾病（CVD）的形式，是全世界死亡的主要原因。如果在早期发现或诊断，存活的几率很好。目前的报告讨论了使用机器学习（ML）算法进行冠心病数据集分类的比较方法。目前的研究创建并测试了几种基于机器学习的分类模型。对数据集进行扫描以处理不平衡的类和特征选择技术，以评估对两个不同性能度量的影响。结果表明，与采用的其他算法相比，逻辑回归在原始数据集中产生了最高的性能分数。总之，本研究表明，加工良好和标准化的数据集上的LR可以预测冠心病，比其他算法更高。

translated by 谷歌翻译

Ensemble feature selection with clustering for analysis of high-dimensional, correlated clinical data in the search for Alzheimer's disease biomarkers

Annette Spooner , Gelareh Mohammadi , Perminder S. Sachdev , Henry Brodaty , Arcot Sowmya

分类：机器学习

2022-07-06

医疗保健数据集通常包含一组高度相关的特征，例如来自同一生物系统的特征。当将功能选择应用于这些数据集以识别最重要的功能时，由于相关功能，由于相关特征而引起的某些多变量特征选择器固有的偏差使这些方法难以区分重要的和无关的特征，并且功能选择过程的结果CAN可以解决。不稳定。已经研究了特征选择合奏，该合奏汇总了多个单个基础特征选择器的结果，已被研究为稳定特征选择结果的一种手段，但不能解决相关特征的问题。我们提出了一个新颖的框架，可以从多元特征选择器中创建特征选择集合，同时考虑了相关特征组产生的偏差，并在预处理步骤中使用团聚层次聚类。这些方法从阿尔茨海默氏病（AD）的研究中应用于两个现实世界数据集，这是一种尚未治愈且尚未完全了解的进行性神经退行性疾病。我们的结果表明，在没有聚类的情况下选择在模型中选择的功能的稳定性有明显的改善，并且这些模型选择的功能与广告文献中的发现保持一致。

translated by 谷歌翻译

Ensemble feature selection with data-driven thresholding for Alzheimer's disease biomarker discovery

Annette Spooner , Gelareh Mohammadi , Perminder S. Sachdev , Henry Brodaty , Arcot Sowmya

分类：机器学习

2022-07-05

医疗保健数据集对机器学习和统计数据都带来了许多挑战，因为它们的数据通常是异质的，审查的，高维的，并且缺少信息。特征选择通常用于识别重要功能，但是当应用于高维数据时，可以产生不稳定的结果，从而在每次迭代中选择一组不同的功能。通过使用特征选择合奏，可以改善特征选择的稳定性，该合奏汇总了多个基本特征选择器的结果。必须将阈值应用于最终的聚合功能集，以将相关功能与冗余功能分开。通常应用的固定阈值不保证最终选定功能仅包含相关功能。这项工作开发了几个数据驱动的阈值，以自动识别集合功能选择器中的相关特征，并评估其预测精度和稳定性。为了证明这些方法对临床数据的适用性，它们被应用于来自两个现实世界中阿尔茨海默氏病（AD）研究的数据。 AD是一种没有已知治愈方法的进行性神经退行性疾病，至少在明显症状出现之前的2-3年开始，为研究人员提供了一个机会，可以鉴定出可能识别有患AD风险的患者的早期生物标志物。通过将这些方法应用于两个数据集来标识的功能反映了广告文献中的当前发现。

translated by 谷歌翻译

The choice of scaling technique matters for classification performance

Lucas B. V. de Amorim , George D. C. Cavalcanti , Rafael M. O. Cruz

分类：机器学习

2022-12-23

Dataset scaling, also known as normalization, is an essential preprocessing step in a machine learning pipeline. It is aimed at adjusting attributes scales in a way that they all vary within the same range. This transformation is known to improve the performance of classification models, but there are several scaling techniques to choose from, and this choice is not generally done carefully. In this paper, we execute a broad experiment comparing the impact of 5 scaling techniques on the performances of 20 classification algorithms among monolithic and ensemble models, applying them to 82 publicly available datasets with varying imbalance ratios. Results show that the choice of scaling technique matters for classification performance, and the performance difference between the best and the worst scaling technique is relevant and statistically significant in most cases. They also indicate that choosing an inadequate technique can be more detrimental to classification performance than not scaling the data at all. We also show how the performance variation of an ensemble model, considering different scaling techniques, tends to be dictated by that of its base model. Finally, we discuss the relationship between a model's sensitivity to the choice of scaling technique and its performance and provide insights into its applicability on different model deployment scenarios. Full results and source code for the experiments in this paper are available in a GitHub repository.\footnote{https://github.com/amorimlb/scaling\_matters}

translated by 谷歌翻译

A Literature Review on Length of Stay Prediction for Stroke Patients using Machine Learning and Statistical Approaches

Ola Alkhatib , Ayman Alahmar

分类：机器学习 | 人工智能

2021-12-30

医院住宿时间（LOS）是最重要的医疗保健度量之一，反映了医院的服务质量，有助于改善医院调度和管理。LOS预测有助于成本管理，因为留在医院的患者通常在资源受到严重限制的情况下这样做。在这项研究中，我们通过机器学习和统计方法审查了LOS预测的论文。我们的文献综述考虑了对卒中患者LOS预测的研究研究。一些受访的研究表明，作者达成了相应的结论。例如，患者的年龄被认为是一些研究中卒中患者LOS的重要预测因子，而其他研究则认为年龄不是一个重要因素。因此，在该领域需要额外的研究以进一步了解卒中患者LOS的预测因子。

translated by 谷歌翻译

A Novel Ontology-guided Attribute Partitioning Ensemble Learning Model for Early Prediction of Cognitive Deficits using Quantitative Structural MRI in Very Preterm Infants

Zhiyuan Li , Hailong Li , Adebayo Braimah , Jonathan R. Dillman , Nehal A. Parikh , Lili He

分类：机器学习

2022-02-08

结构磁共振成像研究表明，大脑解剖异常与早产儿的认知缺陷有关。脑成熟和几何特征可以与机器学习模型一起使用，以预测以后的神经发育缺陷。但是，传统的机器学习模型将遭受较大的功能比率（即大量功能，但少数实例/样本）。合奏学习是一种范式，从战略上生成和集成了机器学习分类器库，并已成功地用于各种预测性建模问题，以提高模型性能。属性（即功能）包装方法是最常用的特征分区方案，它随机和反复从整个功能集中绘制特征子集。尽管属性装袋方法可以有效地降低特征维度以处理大型功能与实用比率，但它缺乏对域知识和特征之间的潜在关系的考虑。在这项研究中，我们提出了一种新型的本体论引导属性分区（OAP）方法，以通过考虑特征之间的特定于域的关系来更好地绘制特征子集。有了更好的分区功能子集，我们开发了一个合奏学习框架，该框架称为OAP汇总学习（OAP-EL）。我们应用了OAP-EL，以使用定量脑成熟和在非常早产的年龄在期限年龄获得的定量脑成熟和几何特征来预测2岁年龄的认知缺陷。我们证明，提出的OAP-EL方法显着优于同行集合学习和传统的机器学习方法。

translated by 谷歌翻译