了解人类行为是一项重要的任务,并且在许多领域(例如针对性的广告,健康分析,安全和娱乐等)都有应用。为此,设计活动识别系统(AR)很重要。但是,由于每个人都可以具有不同的行为,因此理解和分析共同模式成为一项艰巨的任务。由于现代世界中的每个人都很容易获得智能手机,因此使用它们来跟踪人类活动变得可能是可能的。在本文中,我们通过构建Android移动应用程序的Android智能手机的加速度计,磁力计和陀螺仪传感器提取了不同的人类活动。使用不同的社交媒体应用程序,例如Facebook,Instagram,WhatsApp和Twitter,我们提取了原始传感器值以及$ 29 $主题的属性及其属性(类标签),例如年龄,性别,左/右/右/双手的应用使用情况。我们从原始信号中提取功能,并使用它们使用不同的机器学习(ML)算法进行分类。使用统计分析,我们显示了不同特征对类标签预测的重要性。最后,我们在数据上使用训练有素的ML模型来从UCI存储库中众所周知的活动识别数据中提取未知功能,该数据突出了使用ML模型的隐私漏洞的潜力。这种安全分析可以帮助研究人员将来采取适当的步骤来保护人类受试者的隐私。
translated by 谷歌翻译
人们的个人卫生习惯在每日生活方式中照顾身体和健康的状况。保持良好的卫生习惯不仅减少了患疾病的机会,而且还可以降低社区中传播疾病的风险。鉴于目前的大流行,每天的习惯,例如洗手或定期淋浴,在人们中至关重要,尤其是对于单独生活在家里或辅助生活设施中的老年人。本文提出了一个新颖的非侵入性框架,用于使用我们采用机器学习技术的振动传感器监测人卫生。该方法基于地球通传感器,数字化器和实用外壳中具有成本效益的计算机板的组合。监测日常卫生常规可能有助于医疗保健专业人员积极主动,而不是反应性,以识别和控制社区内潜在暴发的传播。实验结果表明,将支持向量机(SVM)用于二元分类,在不同卫生习惯的分类中表现出约95%的有希望的准确性。此外,基于树的分类器(随机福雷斯特和决策树)通过实现最高精度(100%)优于其他模型,这意味着可以使用振动和非侵入性传感器对卫生事件进行分类,以监测卫生活动。
translated by 谷歌翻译
医疗保健是人类生活的重要方面。大流行后,在医疗保健中使用技术的流形增加了。文献中提出的基于物联网的系统和设备可以帮助老年人,儿童和成人面临/经历健康问题。本文详尽地回顾了39个基于可穿戴的数据集,这些数据集可用于评估系统以识别日常生活和跌倒活动。使用五种机器学习方法,即逻辑回归,线性判别分析,K-Nearest邻居,决策树和幼稚的贝叶斯对SIFFALL数据集进行比较分析。数据集以两种方式进行修改,首先使用数据集中存在的所有属性,并以二进制形式标记。第二,计算三个轴(x,y,z)的三个轴(x,y,z)的幅度,然后计算出用于标签属性的实验。实验是对一个受试者,十个受试者和所有受试者进行的,并在准确性,精度和召回方面进行比较。从这项研究中获得的结果证明,KNN在准确性,精度和召回方面胜过其他机器学习方法。还可以得出结论,数据个性化提高了准确性。
translated by 谷歌翻译
Covid-19大流行,仍然是未知的,是一个重要的开放问题。有猜测蝙蝠是可能的起源。同样地,有许多密切相关的(电晕)病毒,例如SARS,发现通过练习圈传递。对潜在的载体和致命病毒发射器的不同主体的研究对于了解,减轻和预防当前和未来的流行性至关重要。在冠状病毒中,表面(S)蛋白或尖峰蛋白是确定宿主特异性的重要组成部分,因为它是病毒与宿主细胞膜之间的接触点。在本文中,我们将超过五千个冠状病毒的刺激蛋白序列分类,将它们分离成艾滋病,蝙蝠,骆驼,猪,人类和奶酪中明显宿主的集群,以命名几个。我们提出了一种基于众所周知的位置重量矩阵(PWM)的特征嵌入,我们呼叫PWM2VEC,并用于从这些冠状虫病毒的尖峰蛋白序列产生特征向量。虽然我们的嵌入受到PWMS在生物应用中的成功,例如确定蛋白质功能,或识别转录因子结合位点,但我们是在来自病毒序列的宿主分类的上下文中使用PWM的第一个(我们的知识)生成固定长度的特征矢量表示。现实世界数据的结果显示,与使用PWM2VEC,与基线模型相比,我们能够相当良好地执行。我们还使用信息增益来测量不同氨基酸的重要性,以显示对预测给定冠状病毒的宿主来说重要的氨基酸。
translated by 谷歌翻译
来自世界卫生组织的现行指南表明,萨尔科夫-2冠状病毒导致新型冠状病毒疾病(Covid-19),通过呼吸液滴或通过接触传输。当受污染的双手触摸嘴巴,鼻子或眼睛的粘膜时,会发生接触传输。此外,病原体也可以通过受污染的手从一个表面转移到另一个表面,这便于通过间接接触传输。因此,手卫生极为重要,无法防止萨尔库夫-2病毒的传播。此外,手工洗涤和/或手摩擦也破坏了其他病毒和细菌的传播,引起常见的感冒,流感和肺炎,从而降低了整体疾病负担。可穿戴设备(如Smartwatches)的巨大扩散,包括加速,旋转,磁场传感器等,以及人工智能的现代技术,如机器学习和最近深度学习,允许开发准确的应用人类活动的认可和分类,如:步行,攀爬楼梯,跑步,拍手,坐着,睡觉等。在这项工作中,我们评估了基于当前智能手​​表的自动系统的可行性,该智能手表能够识别何时受试者洗涤或摩擦它的手,以监测频率和持续时间的参数,并评估手势的有效性。我们的初步结果显示了分别为深度和标准学习技术的约95%和约94%的分类准确性。
translated by 谷歌翻译
人类活动识别(Har)是一个正在进行的研究主题。它具有医疗支持,体育,健身,社交网络,人机界面,高级护理,娱乐,监控以及列表的应用。传统上,电脑视觉方法用于Har,它具有许多问题,例如保密或隐私,环境因素的影响,流动性,更高的运行成本,闭塞等。最近出现了使用传感器,尤其是惯性传感器的新趋势。使用传感器数据作为传统计算机视觉算法的替代方案存在若干优点。在文献中记录了计算机视觉算法的许多局限,包括利用传感器数据的深度神经网络(DNN)和机器学习(ML)方法的研究。我们使用智能手机的惯性传感器数据检查并分析了人类活动识别的不同机器学习和深度学习方法。为了确定哪种方法最适合此应用。
translated by 谷歌翻译
研究表明,心血管疾病(CVD)对人类健康是恶性的研究。因此,重要的是具有有效的CVD预后方法。为此,医疗保健行业采用了基于机器学习的智能解决方案,以减轻CVD预后的手动过程。因此,这项工作提出了一种信息融合技术,该技术通过分析方差(ANOVA)和域专家的知识结合了人的关键属性。它还引入了新的CVD数据样本集,用于新兴研究。进行了三十八个实验,以验证四个公开可用基准数据集中提出的框架的性能以及在这项工作中新创建的数据集。消融研究表明,所提出的方法可以达到竞争平均平均准确性(MAA)为99.2%,平均AUC平均AUC为97.9%。
translated by 谷歌翻译
堕落,特别是在老年人身上,是照顾和监测的重要问题。有很多研究专注于坠落检测。然而,从我们的调查中,仍然没有研究表明前秋季活动,我们认为他们与秋季强度有着强烈的相关性。本研究的目的是开发一个秋季警报系统,也识别出前秋季活动。首先,我们想找到一个合适的位置来将传感器连接到身体。我们创建了多点体内设备以收集各种活动数据。我们使用该数据集培训5种不同的分类模型。我们选择了XGBoost分类模型,用于检测前落下的活动和胸部位置,以便从检测精度的比较中用于坠落检测。然后,我们测试了3个现有的秋季检测阈值算法以首先检测跌倒并落在膝盖上,并在我们的系统中选择了Chaitep和Chawachat [3]的三相阈值算法。从实验中发现,下降检测精度为88.91%,落后于其膝盖首先检测精度为91.25%,检测的平均秋季活动的准确性为86.25%。虽然我们使用年轻人的活动数据集(18-49岁),但我们相信该系统可以开发出来以监测秋季前的活动,特别是在老年人,使得护理人员可以更好地管理这种情况。
translated by 谷歌翻译
步行是人类陆地运动的最常见模式之一。步行对于人类进行大多数日常活动至关重要。当一个人走路时,其中有一个模式,被称为步态。步态分析用于体育和医疗保健。我们可以以不同的方式分析该步态,例如使用监视摄像机捕获的视频或在实验室环境中的深度图像摄像机。它也可以通过可穿戴传感器识别。例如,加速度计,力传感器,陀螺仪,柔性旋转仪,磁电阻传感​​器,电磁跟踪系统,力传感器和肌电图(EMG)。通过这些传感器进行分析需要实验室条件,否则用户必须佩戴这些传感器。为了检测人的步态作用异常,我们需要分别合并传感器。我们可以在发现后通过异常步态知道自己的健康状况。了解常规的步态与异常步态可能会使用智能可穿戴技术对受试者的健康状况有所了解。因此,在本文中,我们提出了一种通过智能手机传感器分析异常步态的方法。尽管如今,大多数人都使用了智能手机和智能手表等智能设备。因此,我们可以使用这些智能可穿戴设备的传感器来追踪他们的步态。
translated by 谷歌翻译
贫困的休息习惯已被鉴定为肌肉骨骼疾病的危险因素,尤其是老年人,残疾人,办公室工人。在目前的计算机化世界中,即使在参与休闲或工作活动时,人们也倾向于花费大部分时间坐在电脑桌前。这可能导致脊柱疼痛和相关问题。因此,一种提醒人们对休息习惯的手段,并为逆损提供建议,如体育锻炼,这是重要的。由于大多数作品侧重于常设姿势,坐姿的姿势识别并没有受到足够的关注。可穿戴传感器,压力或力传感器,视频和图像用于文献中的姿势识别。本研究的目的是通过分析从座椅和靠背的32个压力传感器的椅子上的椅子收集的数据来构建机器学习模型。模型是使用五种算法建造的:随机森林(RF),高斯NA \“IVE Bayes,Logistic回归,支持向量机和深神经网络(DNN)。使用KFOLD交叉验证技术进行评估所有模型。本文提出了实验使用两种单独的数据集,受控和现实进行,并讨论在六个坐姿分类的结果。在受控和现实数据集中分别实现了98%和97%的平均分类精度。
translated by 谷歌翻译
窃取对受控信息的攻击,以及越来越多的信息泄漏事件,已成为近年来新兴网络安全威胁。由于蓬勃发展和部署先进的分析解决方案,新颖的窃取攻击利用机器学习(ML)算法来实现高成功率并导致大量损坏。检测和捍卫这种攻击是挑战性和紧迫的,因此政府,组织和个人应该非常重视基于ML的窃取攻击。本调查显示了这种新型攻击和相应对策的最新进展。以三类目标受控信息的视角审查了基于ML的窃取攻击,包括受控用户活动,受控ML模型相关信息和受控认证信息。最近的出版物总结了概括了总体攻击方法,并导出了基于ML的窃取攻击的限制和未来方向。此外,提出了从三个方面制定有效保护的对策 - 检测,破坏和隔离。
translated by 谷歌翻译
全球2019百万人被感染,450万失去了持续的Covid-19大流行病。直到疫苗变得广泛的可用,预防措施和安全措施,如戴着面具,身体疏远,避免面对面触摸是一些抑制病毒传播的主要手段。脸部触摸是一种强迫性的人Begvior,在不进行持续派生的情况下,不能防止,即使那么它是不可避免的。为了解决这个问题,我们设计了一种基于SmartWatch的解决方案,Covidalert,利用了随机森林算法,从SmartWatch训练了加速度计和陀螺数据,以检测到面部的手动转换,并向用户发送快速触觉警报。 Covidalert是高能量的,因为它使用STA / LTA算法作为网守,在用户处于非活动状态时缩短手表上随机林模型的使用。我们的系统的整体准确性为88.4%,具有低假阴性和误报。我们还通过在商业化石Gen 5 Smartwatch上实现了系统的活力。
translated by 谷歌翻译
由于照顾不断增长的老年人口的医疗和财务需求,对跌倒的及时可靠发现是一个大型且快速增长的研究领域。在过去的20年中,高质量硬件(高质量传感器和AI微芯片)和软件(机器学习算法)技术的可用性通过为开发人员提供开发此类系统的功能,从而成为这项研究的催化剂。这项研究开发了多个应用组件,以研究秋季检测系统的发展挑战和选择,并为未来的研究提供材料。使用此方法开发的智能应用程序通过秋季检测模型实验和模型移动部署的结果验证。总体上表现最好的模型是标准化的RESNET152,并带有2S窗口尺寸的调整数据集,可实现92.8%的AUC,7.28%的灵敏度和98.33%的特异性。鉴于这些结果很明显,加速度计和心电图传感器对秋季检测有益,并允许跌倒和其他活动之间的歧视。由于所得数据集中确定的弱点,这项研究为改进的空间留下了很大的改进空间。这些改进包括在跌落的临界阶段使用标签协议,增加数据集样品的数量,改善测试主题表示形式,并通过频域预处理进行实验。
translated by 谷歌翻译
在本文中,我们报告了使用运动传感器对复杂人类活动分类的分层深度学习模型。与用于基于事件的活动识别的传统人类活动识别(HAR)模型相反,例如阶跃计数,秋季检测和手势识别,这种新的深度学习模型,我们称为魅力(复杂的人类活动识别模型) ,旨在识别高级人类活动,这些活动由非确定性序列中的多个不同的低级活动组成,例如餐食准备,家务和日常工作。魅力不仅优于最先进的监督学习方法,以平均准确性和F1分数来识别高级活动的识别,而且还自动学习识别低级活动,例如操纵手势和运动模式,没有此类活动的任何明确标签。这为使用可穿戴的传感器开辟了新的人机互动(HMI)方式的新途径,用户可以选择将自动化任务与高级活动相关联,例如控制家庭自动化(例如机器人真空吸尘器,灯光,灯光和恒温器)或在正确的时间介绍上下文相关信息(例如,提醒,状态更新和天气/新闻报道)。此外,仅使用高级活动标签进行培训时,学习低级用户活动的能力可能会为半监督的学习HAR任务铺平道路。
translated by 谷歌翻译
It does not matter whether it is a job interview with Tech Giants, Wall Street firms, or a small startup; all candidates want to demonstrate their best selves or even present themselves better than they really are. Meanwhile, recruiters want to know the candidates' authentic selves and detect soft skills that prove an expert candidate would be a great fit in any company. Recruiters worldwide usually struggle to find employees with the highest level of these skills. Digital footprints can assist recruiters in this process by providing candidates' unique set of online activities, while social media delivers one of the largest digital footprints to track people. In this study, for the first time, we show that a wide range of behavioral competencies consisting of 16 in-demand soft skills can be automatically predicted from Instagram profiles based on the following lists and other quantitative features using machine learning algorithms. We also provide predictions on Big Five personality traits. Models were built based on a sample of 400 Iranian volunteer users who answered an online questionnaire and provided their Instagram usernames which allowed us to crawl the public profiles. We applied several machine learning algorithms to the uniformed data. Deep learning models mostly outperformed by demonstrating 70% and 69% average Accuracy in two-level and three-level classifications respectively. Creating a large pool of people with the highest level of soft skills, and making more accurate evaluations of job candidates is possible with the application of AI on social media user-generated data.
translated by 谷歌翻译
Recent research has demonstrated the capability of behavior signals captured by smartphones and wearables for longitudinal behavior modeling. However, there is a lack of a comprehensive public dataset that serves as an open testbed for fair comparison among algorithms. Moreover, prior studies mainly evaluate algorithms using data from a single population within a short period, without measuring the cross-dataset generalizability of these algorithms. We present the first multi-year passive sensing datasets, containing over 700 user-years and 497 unique users' data collected from mobile and wearable sensors, together with a wide range of well-being metrics. Our datasets can support multiple cross-dataset evaluations of behavior modeling algorithms' generalizability across different users and years. As a starting point, we provide the benchmark results of 18 algorithms on the task of depression detection. Our results indicate that both prior depression detection algorithms and domain generalization techniques show potential but need further research to achieve adequate cross-dataset generalizability. We envision our multi-year datasets can support the ML community in developing generalizable longitudinal behavior modeling algorithms.
translated by 谷歌翻译
Covid-19影响了世界各地,尽管对爆发的错误信息的传播速度比病毒更快。错误的信息通过在线社交网络(OSN)传播,通常会误导人们遵循正确的医疗实践。特别是,OSN机器人一直是传播虚假信息和发起网络宣传的主要来源。现有工作忽略了机器人的存在,这些机器人在传播中充当催化剂,并专注于“帖子中共享的文章”而不是帖子(文本)内容中的假新闻检测。大多数关于错误信息检测的工作都使用手动标记的数据集,这些数据集很难扩展以构建其预测模型。在这项研究中,我们通过在Twitter数据集上使用经过验证的事实检查的陈述来标记数据来克服这一数据稀缺性挑战。此外,我们将文本功能与用户级功能(例如关注者计数和朋友计数)和推文级功能(例如Tweet中的提及,主题标签和URL)结合起来,以充当检测错误信息的其他指标。此外,我们分析了推文中机器人的存在,并表明机器人随着时间的流逝改变了其行为,并且在错误信息中最活跃。我们收集了1022万个Covid-19相关推文,并使用我们的注释模型来构建一个广泛的原始地面真实数据集以进行分类。我们利用各种机器学习模型来准确检测错误信息,我们的最佳分类模型达到了精度(82%),召回(96%)和假阳性率(3.58%)。此外,我们的机器人分析表明,机器人约为错误信息推文的10%。我们的方法可以实质性地暴露于虚假信息,从而改善了通过社交媒体平台传播的信息的可信度。
translated by 谷歌翻译
COVID-19大流行的快速扩散导致SARS-COV-2基因组的序列数据量很大,数百万序列和计数。尽管超出传统方法的能力来理解病毒的多样性,动态和演变的能力,但这一数量的数量幅度仍然是机器学习(ML)方法的丰富资源(ML)作为从这些数据中提取此类重要信息的替代方法。因此,设计一个用于测试和基准测试这些ML模型的鲁棒性的框架至关重要。本文(据我们所知)首次努力通过使用错误模拟生物学序列来基准ML模型的鲁棒性。在本文中,我们介绍了几种方法来扰动SARS-COV-2基因组序列,以模仿普通测序平台(例如Illumina和pacbio)的误差曲线。我们从在各种ML模型上的实验中证明,对于某些特定的嵌入方法,某些基于仿真的方法比其他针对输入序列的对抗性攻击更健壮(和准确)。我们的基准测试框架可以帮助研究人员正确评估不同的ML模型,并帮助他们了解SARS-COV-2病毒的行为或避免未来可能的大流行。
translated by 谷歌翻译
机器学习(ML)模型,例如SVM,用于分类和序列的聚类等任务,需要定义序列对之间的距离/相似性。已经提出了几种方法来计算序列之间的相似性,例如确切的方法计算$ k $ -s-mers(长度$ k $的子序列)之间的匹配数和估计成对相似性得分的近似方法。尽管精确的方法产生了更好的分类性能,但它们的计算成本很高,将其适用性限制在少量序列中。事实证明,近似算法更可扩展,并具有相当的性能(有时更好)确切方法 - 它们以“一般”方式设计用于处理不同类型的序列(例如音乐,蛋白质等)。尽管一般适用性是算法的所需属性,但在所有情况下都不是这种情况。例如,在当前的Covid-19(冠状病毒)大流行中,需要一种可以专门处理冠状病毒的方法。为此,我们提出了一系列方法来提高近似内核的性能(使用最小化和信息增益),以增强其预测性能PM冠状病毒序列。更具体地说,我们使用域知识(使用信息增益计算)和有效的预处理(使用最小值计算)来提高近似内核的质量,以对与不同变体相对应的冠状病毒峰值蛋白序列进行分类(例如,Alpha,Beta,Beta,Gamma)。我们使用不同的分类和聚类算法报告结果,并使用多个评估指标评估其性能。使用两个数据集,我们表明我们提出的方法有助于与医疗保健领域的基线和最先进的方法相比,有助于提高内核的性能。
translated by 谷歌翻译
痴呆症是一种神经精神脑障碍,通常会在一个或多个脑细胞停止部分或根本停止工作时发生。在疾病的早期阶段诊断这种疾病是从不良后果中挽救生命并为他们提供更好的医疗保健的至关重要的任务。事实证明,机器学习方法在预测疾病早期痴呆症方面是准确的。痴呆的预测在很大程度上取决于通常从归一化的全脑体积(NWBV)和地图集缩放系数(ASF)收集的收集数据类型,这些数据通常测量并从磁共振成像(MRIS)中进行校正。年龄和性别等其他生物学特征也可以帮助诊断痴呆症。尽管许多研究使用机器学习来预测痴呆症,但我们无法就这些方法的稳定性得出结论,而这些方法在不同的实验条件下更准确。因此,本文研究了有关痴呆预测的机器学习算法的性能的结论稳定性。为此,使用7种机器学习算法和两种功能还原算法,即信息增益(IG)和主成分分析(PCA)进行大量实验。为了检查这些算法的稳定性,IG的特征选择阈值从20%更改为100%,PCA尺寸从2到8。这导致了7x9 + 7x7 = 112实验。在每个实验中,都记录了各种分类评估数据。获得的结果表明,在七种算法中,支持向量机和天真的贝叶斯是最稳定的算法,同时更改选择阈值。同样,发现使用IG似乎比使用PCA预测痴呆症更有效。
translated by 谷歌翻译