智能论文笔记

A Machine Learning Analysis of COVID-19 Mental Health Data

Mostafa Rezapour , Lucas Hansen

分类：机器学习

2021-12-01

2019年12月底，首先在武汉中国首次确定了新型冠状病毒（SARS-COV-2）和所得疾病Covid-19。该疾病通过遏制措施滑落，其中一个已知的案例在美国在2020年1月20日被确定。在本文中，我们利用来自大学间财团的调查数据进行政治和社会研究，并应用几种统计和机器学习模型和技术，如决策树，多项式物流回归，天真贝叶斯，k-intele邻居，支持向量机，神经网络，随机森林，梯度树提升，Xgboost，Catboost，LightGBM，合成少数群体过采样和Chi-Squared测试分析Covid-19大流行对美国前线工人心理健康的影响。通过对适用于心理健康调查数据的许多模型的解释，我们已经得出结论，预测前线工人心理健康衰退的最重要因素是个人所在的医疗保健角色（护士，急诊室工作人员，外科医生，），其次是个人在上周睡眠量，Covid-19相关新闻的数量在一天，工人的年龄和酒精和大麻的使用量平均消耗。

translated by 谷歌翻译

Hidden Effects of COVID-19 on Healthcare Workers: A Machine Learning Analysis

Mostafa Rezapour

分类：机器学习

2021-12-12

在本文中，我们分析了Covid-19大流行对医疗工作者的一些影响。我们专注于使用从密歇根州大学大学大学联盟大学获得政治和社会研究的心理健康调查数据，专注于酒精消费习惯改变。我们使用监督和无监督的机器学习方法和模型，如决策树，Logistic回归，天真贝叶斯分类器，K到最近的邻居，支持向量机，多层森林，XGBoost，Catboost，LightGBM，合成少数群体过采样，Chi-Squared测试与互信息方法，了解Covid-19相关负面影响与医疗保健工人的饮酒变化的关系。我们的调查结果表明，Covid-19大流行的一些效果如学校关闭，工作时间表变更和科夫迪相关的新闻曝光可能导致酒精使用增加。

translated by 谷歌翻译

Artificial Intelligence-Based Analytics for Impacts of COVID-19 and Online Learning on College Students' Mental Health

Mostafa Rezapour , Scott K. Elmshaeuser

分类：机器学习

2022-02-07

Covid-19是由新型冠状病毒（SARS-COV-2）引起的疾病，于2019年12月下旬首次在中国武汉出现。不久之后，该病毒在全球范围内传播，并于3月被世界卫生组织宣布为大流行病。 2020年。这造成了世界各地和美国的许多变化，包括向在线学习的教育转变。在本文中，我们试图了解Covid-19-19的大流行和在线学习的增加如何影响大学生的情感福祉。我们使用几种机器学习和统计模型来分析卢布尔雅那大学公共行政学院，斯洛文尼亚大学，与国际大学，其他高等教育机构和学生协会一起收集的数据。我们的结果表明，与学生的学术生活有关的特征对他们的情感健康产生了最大的影响。其他重要因素包括学生对大学和政府对大流行的处理以及学生的财务安全的满意。

translated by 谷歌翻译

Prediction Model for Mortality Analysis of Pregnant Women Affected With COVID-19

Quazi Adibur Rahman Adib , Sidratul Tanzila Tasmi , Md. Shahriar Islam Bhuiyan , Md. Mohsin Sarker Raihan , Abdullah Bin Shams

分类：机器学习 | 人工智能

2021-11-22

Covid-19 Pandemic是一个持续的全球大流行，这导致了公共卫生部门和全球经济中的前所未有的中断。病毒，SARS-COV-2负责冠状病毒病的快速传播。由于其传染性，病毒可以容易地感染不受保护和暴露的个体，从轻度到严重症状。对怀孕母亲和新生儿的病毒效应的研究现在是平民和公共卫生工作者在全球范围内的关于病毒如何影响母亲和新生儿健康的问题。本文旨在制定一种预测模型，以估算基于记录的症状的携带型患者死亡的可能性：呼吸困难，咳嗽，鼻子，关节痛和肺炎的诊断。我们研究中使用的机器学习模型是支持向量机，决策树，随机林，渐变升压和人工神经网络。该模型提供了令人印象深刻的结果，可以准确地预测给定输入的怀孕母亲的死亡率。3型号（ANN，渐变升压，随机林）的精度率为100％，最高精度得分（梯度提升，ANN）是95 ％，最高召回（支持向量机）为92.75％，最高F1得分（梯度提升，ANN）为94.66％。由于模型的准确性，怀孕的母亲可以基于其由于病毒而导致的可能性即时治疗。全球卫生工人可以利用该模型列出急诊患者，最终可以降低Covid-19诊断患者的死亡率。

translated by 谷歌翻译

Enhancement of Healthcare Data Transmission using the Levenberg-Marquardt Algorithm

Angela An , James Jin Kang

分类：机器学习

2022-06-09

在医疗保健系统中，需要患者使用可穿戴设备进行远程数据收集和对健康数据的实时监控以及健康状况的状态。可穿戴设备的这种采用导致收集和传输的数据量显着增加。由于设备由较小的电池电源运行，因此由于设备的高处理要求以进行数据收集和传输，因此可以快速减少它们。鉴于医疗数据的重要性，必须所有传输数据遵守严格的完整性和可用性要求。减少医疗保健数据的量和传输频率将通过使用推理算法改善设备电池寿命。有一个以准确性和效率改善传输指标的问题，彼此之间的权衡，例如提高准确性会降低效率。本文表明，机器学习可用于分析复杂的健康数据指标，例如数据传输的准确性和效率，以使用Levenberg-Marquardt算法来克服权衡问题，从而增强这两个指标，从而通过少较少的样本来传输，同时保持维护准确性。使用标准心率数据集测试该算法以比较指标。结果表明，LMA最好以3.33倍的效率进行样本数据尺寸和79.17％的精度，在7种不同的采样案例中具有相似的准确性，用于测试，但表明效率提高。与具有高效率的现有方法相比，这些提出的方法使用机器学习可以显着改善两个指标，而无需牺牲其他指标。

translated by 谷歌翻译

Machine Learning and Ensemble Approach Onto Predicting Heart Disease

Aaditya Surya

分类：机器学习 | 人工智能

2021-11-16

一个躺在胸腔里的心脏的四个基本腔腔对一个人的生存至关重要，但讽刺地证明是最脆弱的。心血管疾病（CVD）也通常被称为心脏病，在过去几十年中，人类在人类死亡原因中稳步发展。考虑到这一点统计，很明显，患有CVDS的患者需要快速且正确的诊断，以便于早期治疗来减少死亡的机会。本文试图利用提供的数据，以培训分类模型，如逻辑回归，k最近邻居，支持向量机，决策树，高斯天真贝叶斯，随机森林和多层感知（人工神经网络），最终使用柔软投票合奏技术，以便尽可能多地诊断。

translated by 谷歌翻译

Common human diseases prediction using machine learning based on survey data

Jabir Al Nahian , Abu Kaisar Mohammad Masum , Sheikh Abujar , Md. Jueal Mia

分类：机器学习

2022-09-22

在这个时代，作为医疗的主要重点，这一时刻已经到来了。尽管令人印象深刻，但已经开发出来检测疾病的多种技术。此时，有一些类型的疾病COVID-19，正常烟，偏头痛，肺病，心脏病，肾脏疾病，糖尿病，胃病，胃病，胃病，骨骼疾病，自闭症是非常常见的疾病。在此分析中，我们根据疾病的症状进行了分析疾病症状的预测。我们研究了一系列症状，并接受了人们的调查以完成任务。已经采用了几种分类算法来训练模型。此外，使用性能评估矩阵来衡量模型的性能。最后，我们发现零件分类器超过了其他分类器。

translated by 谷歌翻译

Examining stability of machine learning methods for predicting dementia at early phases of the disease

Sinan Faouri , Mahmood AlBashayreh , Mohammad Azzeh

分类：机器学习 | 人工智能

2022-09-10

痴呆症是一种神经精神脑障碍，通常会在一个或多个脑细胞停止部分或根本停止工作时发生。在疾病的早期阶段诊断这种疾病是从不良后果中挽救生命并为他们提供更好的医疗保健的至关重要的任务。事实证明，机器学习方法在预测疾病早期痴呆症方面是准确的。痴呆的预测在很大程度上取决于通常从归一化的全脑体积（NWBV）和地图集缩放系数（ASF）收集的收集数据类型，这些数据通常测量并从磁共振成像（MRIS）中进行校正。年龄和性别等其他生物学特征也可以帮助诊断痴呆症。尽管许多研究使用机器学习来预测痴呆症，但我们无法就这些方法的稳定性得出结论，而这些方法在不同的实验条件下更准确。因此，本文研究了有关痴呆预测的机器学习算法的性能的结论稳定性。为此，使用7种机器学习算法和两种功能还原算法，即信息增益（IG）和主成分分析（PCA）进行大量实验。为了检查这些算法的稳定性，IG的特征选择阈值从20％更改为100％，PCA尺寸从2到8。这导致了7x9 + 7x7 = 112实验。在每个实验中，都记录了各种分类评估数据。获得的结果表明，在七种算法中，支持向量机和天真的贝叶斯是最稳定的算法，同时更改选择阈值。同样，发现使用IG似乎比使用PCA预测痴呆症更有效。

translated by 谷歌翻译

On Effectively Predicting Autism Spectrum Disorder Using an Ensemble of Classifiers

Bhekisipho Twala , Eamon Molloy

分类：机器学习

2022-09-02

分类器的合奏结合了几个单个分类器，以提供最终的预测或分类决策。一个越来越令人发指的问题是，此类系统是否可以胜过单个最佳分类器。如果是这样，哪种形式的分类器合奏（也称为多个分类器学习系统或多个分类器）在合奏本身的规模或多样性中产生最重要的好处？鉴于用于检测自闭症特征的测试是耗时且昂贵的，因此开发了一种将提供最佳结果和测量自闭症谱系障碍（ASD）的系统。在本文中，评估了几个单一和后来的多个分类器学习系统，以预测和确定影响或有助于ASD的因素出于早期筛查目的的能力。行为数据和机器人增强疗法的3,000次课程和300小时的数据集，该疗法被记录为61名儿童。仿真结果表明，与单个分类器相比，多个分类器学习系统（尤其是每个集合具有三个分类器的人）的优越预测性能，可以通过装袋和增强获得出色的结果。看来，社会交流手势仍然是儿童ASD问题的关键因素。

translated by 谷歌翻译

Impact Learning: A Learning Method from Features Impact and Competition

Nusrat Jahan Prottasha , Saydul Akbar Murad , Abu Jafar Md Muzahid , Masud Rana , Md Kowsher , Apurba Adhikary , Sujit Biswas , Anupam Kumar Bairagi

分类：机器学习 | 人工智能

2022-11-04

Machine learning is the study of computer algorithms that can automatically improve based on data and experience. Machine learning algorithms build a model from sample data, called training data, to make predictions or judgments without being explicitly programmed to do so. A variety of wellknown machine learning algorithms have been developed for use in the field of computer science to analyze data. This paper introduced a new machine learning algorithm called impact learning. Impact learning is a supervised learning algorithm that can be consolidated in both classification and regression problems. It can furthermore manifest its superiority in analyzing competitive data. This algorithm is remarkable for learning from the competitive situation and the competition comes from the effects of autonomous features. It is prepared by the impacts of the highlights from the intrinsic rate of natural increase (RNI). We, moreover, manifest the prevalence of the impact learning over the conventional machine learning algorithm.

translated by 谷歌翻译

Analysis of the Effectiveness of Face-Coverings on the Death Ratio of COVID-19 Using Machine Learning

Ali Lafzi , Miad Boodaghi , Siavash Zamani , Niyousha Mohammadshafie , Veeraraghava Raju Hasti

分类： (统计)机器学习 | 机器学习

2021-02-08

最近的Covid-19爆发导致全球数百万人死亡。为了避开病毒的传播，美国的当局就业不同的策略，包括各国州长发出的面具授权命令。在当前的工作中，我们定义了一个称为平均死亡比率的参数，作为日常死亡人数的月平均每日案件的平均案件。我们利用调查数据通过面具授权命令量化人们的尊重。此外，我们隐含地解决了人们遵守可能取决于人口，收入和教育水平等一些参数的掩模授权的程度。使用不同的机器学习分类算法，我们调查了美国西海岸县死亡比率的减少或增加与输入参数相关。结果表明，对于大多数县来说，面膜授权顺序减少了反映了这一预防措施对西海岸的有效性的死亡比率。此外，死亡率的变化表现出明显的与每个县的社会经济状况有明显的相关性。此外，结果表明，高达约90％的高达约90％的有前途的分类精度得分。

translated by 谷歌翻译

Machine Learning to Predict the Antimicrobial Activity of Cold Atmospheric Plasma-Activated Liquids

Mehmet Akif Ozdemir , Gizem Dilara Ozdemir , Merve Gul , Onan Guren , Utku Kursat Ercan

分类：机器学习

2022-07-25

血浆定义为物质的第四个状态，在高电场下可以在大气压下产生非热血浆。现在众所周知，血浆激活液体（PAL）的强和广谱抗菌作用。机器学习（ML）在医疗领域的可靠适用性也鼓励其在等离子体医学领域的应用。因此，在PALS上的ML应用可以提出一种新的观点，以更好地了解各种参数对其抗菌作用的影响。在本文中，通过使用先前获得的数据来定性预测PAL的体外抗菌活性，从而介绍了比较监督的ML模型。进行了文献搜索，并从33个相关文章中收集了数据。在所需的预处理步骤之后，将两种监督的ML方法（即分类和回归）应用于数据以获得微生物灭活（MI）预测。对于分类，MI分为四类，对于回归，MI被用作连续变量。为分类和回归模型进行了两种不同的可靠交叉验证策略，以评估所提出的方法。重复分层的K折交叉验证和K折交叉验证。我们还研究了不同特征对模型的影响。结果表明，高参数优化的随机森林分类器（ORFC）和随机森林回归者（ORFR）分别比其他模型进行了分类和回归的模型更好。最后，获得ORFC的最佳测试精度为82.68％，ORFR的R2为0.75。 ML技术可能有助于更好地理解在所需的抗菌作用中具有主要作用的血浆参数。此外，此类发现可能有助于将来的血浆剂量定义。

translated by 谷歌翻译

Leak Detection in Natural Gas Pipeline Using Machine Learning Models

Adebayo Oshingbesan

分类：机器学习

2022-09-21

天然气管道中的泄漏检测是石油和天然气行业的一个重要且持续的问题。这尤其重要，因为管道是运输天然气的最常见方法。这项研究旨在研究数据驱动的智能模型使用基本操作参数检测天然气管道的小泄漏的能力，然后使用现有的性能指标比较智能模型。该项目应用观察者设计技术，使用回归分类层次模型来检测天然气管道中的泄漏，其中智能模型充当回归器，并且修改后的逻辑回归模型充当分类器。该项目使用四个星期的管道数据流研究了五个智能模型（梯度提升，决策树，随机森林，支持向量机和人工神经网络）。结果表明，虽然支持向量机和人工神经网络比其他网络更好，但由于其内部复杂性和所使用的数据量，它们并未提供最佳的泄漏检测结果。随机森林和决策树模型是最敏感的，因为它们可以在大约2小时内检测到标称流量的0.1％的泄漏。所有智能模型在测试阶段中具有高可靠性，错误警报率为零。将所有智能模型泄漏检测的平均时间与文献中的实时短暂模型进行了比较。结果表明，智能模型在泄漏检测问题中的表现相对较好。该结果表明，可以与实时瞬态模型一起使用智能模型，以显着改善泄漏检测结果。

translated by 谷歌翻译

What Are You Anxious About? Examining Subjects of Anxiety during the COVID-19 Pandemic

Lucia L. Chen , Steven R. Wilson , Sophie Lohmann , Daniela V. Negraia

分类：自然语言处理

2022-09-27

Covid-19在大流行的不同阶段对公众构成了不成比例的心理健康后果。我们使用一种计算方法来捕获引发在线社区对大流行的焦虑的特定方面，并研究这些方面如何随时间变化。首先，我们使用主题分析在R/covid19 \ _support的Reddit帖子样本（$ n $ = 86）中确定了九个焦虑（SOA）。然后，我们通过在手动注释的样本（$ n $ = 793）上训练Reddit用户的焦虑来自动将SOA标记在较大的年代样本中（$ n $ = 6,535）。 9个SOA与最近开发的大流行焦虑测量量表中的项目保持一致。我们观察到，在大流行的前八个月，Reddit用户对健康风险的担忧仍然很高。尽管案件激增稍后发生，但这些担忧却大大减少了。通常，随着大流行的进展，用户的语言披露了SOA的强烈强度。但是，在本研究涵盖的整个期间，人们对心理健康的担忧和未来稳步增长。人们还倾向于使用更强烈的语言来描述心理健康问题，而不是健康风险或死亡问题。我们的结果表明，尽管Covid-19逐渐削弱，但由于适当的对策而逐渐削弱了作为健康威胁，但该在线小组的心理健康状况并不一定会改善。我们的系统为人口健康和流行病学学者奠定了基础，以及时检查引起大流行焦虑的方面。

translated by 谷歌翻译

Mental Illness Classification on Social Media Texts using Deep Learning and Transfer Learning

Iqra Ameer , Muhammad Arif , Grigori Sidorov , Helena Gòmez-Adorno , Alexander Gelbukh

分类：机器学习 | 自然语言处理

2022-07-03

鉴于当前全球的社交距离限制，大多数人现在使用社交媒体作为其主要交流媒介。因此，数百万患有精神疾病的人被孤立了，他们无法亲自获得帮助。他们越来越依赖在线场地，以表达自己并寻求有关处理精神障碍的建议。根据世界卫生组织（WHO）的说法，大约有4.5亿人受到影响。精神疾病（例如抑郁，焦虑等）非常普遍，并影响了个体的身体健康。最近提出了人工智能（AI）方法，以帮助基于患者的真实信息（例如，医疗记录，行为数据，社交媒体利用等），包括精神病医生和心理学家在内的心理健康提供者。 AI创新表明，在从计算机视觉到医疗保健的众多现实应用应用程序中，主要执行。这项研究分析了REDDIT平台上的非结构化用户数据，并分类了五种常见的精神疾病：抑郁，焦虑，双相情感障碍，ADHD和PTSD。我们培训了传统的机器学习，深度学习和转移学习多级模型，以检测个人的精神障碍。这项工作将通过自动化检测过程并告知适当当局需要紧急援助的人来使公共卫生系统受益。

translated by 谷歌翻译

Explainable predictions of different machine learning algorithms used to predict Early Stage diabetes

V. Vakil , S. Pachchigar , C. Chavda , S. Soni

分类：机器学习 | 人工智能

2021-11-18

机器学习和人工智能可广泛用于诊断慢性疾病，以便可以在关键时间内进行必要的预防治疗。糖尿病是由几种机器学习算法容易诊断的主要疾病之一。早期诊断至关重要，以防止危险后果。在本文中，我们对多种机器学习算法的比较分析了。随机森林，决策树，人工神经网络，K最近邻居，支持向量机和XGBoost以及使用Shav的特征归因，以确定预测从Sylhet医院收集的数据集上的糖尿病的最重要特征。根据所获得的实验结果，随机森林算法表现优于所有其他算法，在该特定数据集中的精度为99％。

translated by 谷歌翻译

A Computational Exploration of Emerging Methods of Variable Importance Estimation

Louis Mozart Kamdem , Ernest Fokoue

分类： (统计)机器学习 | 机器学习

2022-08-05

估计变量的重要性是现代机器学习的重要任务。这有助于评估给定模型中功能的优点。在过去的十年中，已经开发了几种估计变量重要性的技术。在本文中，我们提出了对可变重要性估计的新兴方法的计算和理论探索，即：绝对收缩和选择操作员（LASSO），支持向量机（SVM），预测误差函数（Perf），随机森林（随机森林）（ RF）和极端梯度提升（XGBOOST）在不同类型的现实生活和模拟数据上进行了测试。所有这些方法都可以无缝处理回归和分类任务，但是在处理包含丢失值的数据时都失败了。该实现表明，在高度相关数据的情况下，PURD具有最佳性能，紧随其后的是RF。 perf和xgboost是“渴望数据”的方法，它们在小数据尺寸上的性能最差，但在执行时间方面它们是最快的。当数据集中许多冗余功能时，SVM是最合适的。 perf的盈余是其自然截止量的零截止，有助于将正面和负分数分开，所有正分数表明基本和重要的特征，而负面分数表示无用的特征。 RF和Lasso的通用性非常多，尽管它们没有给予最佳效果，但它们几乎可以在所有情况下使用。

translated by 谷歌翻译

Anxolotl, an Anxiety Companion App -- Stress Detection

Nuno Gomes , Matilde Pato , Pedro Santos , André Lourenço , Lourenço Rodrigues

分类：机器学习

2022-12-28

Stress has a great effect on people's lives that can not be understated. While it can be good, since it helps humans to adapt to new and different situations, it can also be harmful when not dealt with properly, leading to chronic stress. The objective of this paper is developing a stress monitoring solution, that can be used in real life, while being able to tackle this challenge in a positive way. The SMILE data set was provided to team Anxolotl, and all it was needed was to develop a robust model. We developed a supervised learning model for classification in Python, presenting the final result of 64.1% in accuracy and a f1-score of 54.96%. The resulting solution stood the robustness test, presenting low variation between runs, which was a major point for it's possible integration in the Anxolotl app in the future.

translated by 谷歌翻译

Prediction of Dilatory Behavior in eLearning: A Comparison of Multiple Machine Learning Models

Christof Imhof , Ioan-Sorin Comsa , Martin Hlosta , Behnam Parsaeifard , Ivan Moser , Per Bergamin

分类： (统计)机器学习 | 机器学习

2022-06-30

拖延是任务的非理性延迟，是在线学习中的普遍情况。潜在的负面后果包括更高的辍学风险，增加压力和情绪减少。由于学习管理系统和学习分析的增加，可以检测到这种行为的指标，从而预测未来的拖延和其他扩张行为。但是，关注此类预测的研究很少。此外，几乎不存在涉及不同类型的预测指标和预测性能之间的比较的研究。在这项研究中，我们旨在通过分析多个机器学习算法的性能来填补这些研究空白，以预测具有两类预测指标的高等教育环境中在线作业的延迟或及时提交：基于主观的，基于问卷的变量和目标，客观，客观，客观，目标，客观，客观，客观，客观，从学习管理系统中提取的基于日志数据的指标。结果表明，具有客观预测变量的模型始终优于主观预测指标的模型，并且两种变量类型的组合表现稍好一些。对于这三个选项中的每一个，一种不同的方法盛行（主观，贝叶斯多层次模型的梯度增强机器，共同预测指标的随机森林）。我们得出的结论是，在学习管理系统中实施此类模型之前，应仔细注意预测变量和算法。

translated by 谷歌翻译

Decision Tree-Based Predictive Models for Academic Achievement Using College Students' Support Networks

Anthony Frazier , Joethi Silva , Rachel Meilak , Indranil Sahoo , David Chan , Michael Broda

分类： (统计)机器学习 | 机器学习

2021-08-31

在这项研究中，我们研究了一组从484名在美国中部地区大西洋地区一所大型公立大学招收的学生收集的主要数据。数据称为纽带数据，包括学生的人口统计和支持网络信息。支持网络数据由强调支持类型的信息（即情感或教育；常规或激烈）。使用此数据集，使用卡方自动互动检测（CHAID），决策树算法和CFOREST（一种随机的森林算法）创建了用于预测学生自我报告的GPA的学术成就的模型，该模型是使用条件推理的Cforest创建的树。我们比较方法的精度和变化在每种算法建议的一组重要变量集中。每种算法都发现，不同的变量对于不同的学生人口统计学很重要。对于白人学生来说，不同类型的教育支持对于预测学术成就很重要，而对于非白人学生来说，不同类型的情感支持对于预测学术成就很重要。不同类型的常规支持的存在对于预测顺格西格妇女的学术成就很重要，而不同类型的强烈支持对于预测cisgender男性的学术成就很重要。

translated by 谷歌翻译