肥胖是一种全球流行病,每年至少有280万人死亡。这种复杂的疾病与重大的社会经济负担有关,工作生产率降低,失业和其他健康差异(SDOH)差异有关。目的:这项研究的目的是使用地理空间机器学习方法研究SDOH对美国谢尔比县成年人肥胖症患病率的影响。肥胖症患病率是从公共可用的CDC 500城市数据库中获得的,而SDOH指标是从美国人口普查和USDA提取的。我们使用Getis-ord Gi*统计数据和校准多个模型研究了肥胖症患病率模式的地理分布,以研究SDOH与成人肥胖之间的关联。此外,使用无监督的机器学习来进行分组分析,以研究肥胖症患病率和相关SDOH指标的分布。结果表明,在谢尔比县内经历了成年肥胖症高的社区中,很高的社区。在人口普查区中,家庭收入中位数以及黑人,房屋租房者的百分比,居住在贫困水平以下的人,五十五岁或以上,未婚和未投保的人与成人肥胖症患病率有显着关联。分组分析表明,处境不利的社区之间的肥胖症患病率差异。需要更多的研究来检查地理位置,SDOH和慢性疾病之间的联系。这些发现描述了处于不利地位的社区内肥胖症的患病率明显更高,并且可以利用其他地理空间信息,以提供有价值的见解,以告知健康决策和干预措施,从而减轻肥胖症患病率的危险因素。
translated by 谷歌翻译
COVID-19的传播表明,在不同的城市和社区之间,传播风险模式不是同质的,各种异质特征会影响传播轨迹。因此,对于预测性大流行监测,至关重要的是,在城市和社区中探索潜在的异质特征,以区分其特定的大流行扩散轨迹。为此,这项研究创建了一个网络嵌入模型,捕获跨县的访问网络以及异质特征,以根据其大流行传播轨迹来发现美国县的集群。我们从3月3日至2020年6月29日(初始波浪)收集了2,787个县的位置智能特征。其次,我们构建了一个人类访问网络,该网络将县特征作为节点属性和县之间的访问作为网络边缘。我们的归因网络嵌入方法整合了跨县访问网络的类型学特征以及异质性特征。我们对属性网络嵌入进行了聚类分析,以揭示与四个县群相对应的差异风险轨迹的四种原型。随后,我们确定了四个功能是原型之间独特的传输风险模式的重要特征。归因的网络嵌入方法和发现识别并解释了整个县的非殖民性大流行风险轨迹进行预测性大流行监测。这项研究还为大流行分析的基于数据驱动和深度学习的方法有助于补充大流行病政策分析的标准流行病学模型。
translated by 谷歌翻译
城市化及其问题需要对城市动态,尤其是现代城市复杂而多样化的生活方式的深入和全面的了解。数字化的数据可以准确捕获复杂的人类活动,但缺乏人口统计数据的解释性。在本文中,我们研究了美国11个都会区的120万人到110万个地方的出行探访模式的隐私增强数据集,以检测美国最大的美国城市中的潜在行动行为和生活方式。尽管出行访问的复杂性很大,但我们发现生活方式可以自动分解为12种潜在的可解释的活动行为,人们如何将购物,饮食,工作或利用空闲时间结合起来。我们没有描述具有单一生活方式的人,而是发现城市居民的行为是这些行为的混合。那些被检测到的潜在活动行为同样存在于城市之间,无法通过主要人口特征来完全解释。最后,我们发现这些潜在行为与在控制人口特征之后,即使在控制人口特征之后,这些潜在行为也与经验丰富的收入隔离,运输或健康行为有关。我们的结果表明,与活动行为相辅相成,以了解城市动态的重要性。
translated by 谷歌翻译
The node-place model has been widely used to classify and evaluate transit stations, which sheds light on individual travel behaviors and supports urban planning through effectively integrating land use and transportation development. This article adapts this model to investigate whether and how node, place, and mobility would be associated with the transmission risks and presences of the local COVID-19 cases in a city. Similar studies on the model and its relevance to COVID-19, according to our knowledge, have not been undertaken before. Moreover, the unique metric drawn from detailed visit history of the infected, i.e., the COVID-19 footprints, is proposed and exploited. This study then empirically uses the adapted model to examine the station-level factors affecting the local COVID-19 footprints. The model accounts for traditional measures of the node and place as well as actual human mobility patterns associated with the node and place. It finds that stations with high node, place, and human mobility indices normally have more COVID-19 footprints in proximity. A multivariate regression is fitted to see whether and to what degree different indices and indicators can predict the COVID-19 footprints. The results indicate that many of the place, node, and human mobility indicators significantly impact the concentration of COVID-19 footprints. These are useful for policy-makers to predict and monitor hotspots for COVID-19 and other pandemics transmission.
translated by 谷歌翻译
Covid-19疾病迅速蔓延,在中国确认第一个积极案件后近三个月,冠状病毒开始遍布美国。一些州和县报告了大量的积极病例和死亡,而一些据报道的Covid-19相关病例和死亡率。本文在县级分析了可能影响Covid-19感染和死亡率风险的因素。使用K-Means聚类和多种分类模型的创新方法来确定最关键的因素。结果表明,平均温度,低于贫困人数,肥胖,空气压力,人口密度,风力速度,经度和未知人民百分比的成年人的百分比是最重要的属性
translated by 谷歌翻译
超重和肥胖仍然是一个主要的全球性公共健康问题,并确定增加未来体重增加风险的个性化模式在预防肥胖症和许多与肥胖症相关的次螯症方面具有至关重要的作用。在这项工作中,我们使用规则发现方法来研究这个问题,通过呈现提供真正的解释性和同时优化所识别模式的准确性(经常正确)的准确性(适用于许多样本)的方法来研究这个问题。具体而言,我们扩展了一个已建立的子组 - 发现方法以生成类型X-> Y的所需规则,并显示如何从X侧提取最高特征,作为Y的最佳预测因子。在我们的肥胖问题中,X是指来自非常大的和多站点EHR数据的提取功能,y表示大量的重量。使用我们的方法,我们还广泛地比较了由个人性别,年龄,种族,保险类型,邻里类型和收入水平决定的22层模式中的模式中的差异和不平等。通过广泛的实验,我们对未来危险体重增加的预测变量显示出新的和互补结果。
translated by 谷歌翻译
医院住宿时间(LOS)是最重要的医疗保健度量之一,反映了医院的服务质量,有助于改善医院调度和管理。LOS预测有助于成本管理,因为留在医院的患者通常在资源受到严重限制的情况下这样做。在这项研究中,我们通过机器学习和统计方法审查了LOS预测的论文。我们的文献综述考虑了对卒中患者LOS预测的研究研究。一些受访的研究表明,作者达成了相应的结论。例如,患者的年龄被认为是一些研究中卒中患者LOS的重要预测因子,而其他研究则认为年龄不是一个重要因素。因此,在该领域需要额外的研究以进一步了解卒中患者LOS的预测因子。
translated by 谷歌翻译
自从20020年9月在世界上越来越多的Covid-19,截至世界上的确认病例和死亡人数最多,该国大多数国家都强制了行动限制,导致流动性急剧减少。然而,这场危机的整体影响和长期影响旅行和流动仍然不确定。为此,本研究开发了一个分析框架,决定和分析了影响人类流动性和在美国的最主要的因素。特别是,该研究使用GRANGER因果关系来确定影响日常车辆数英里的重要预测因子,并利用包括脊和套索技术的线性正则化算法,以模拟和预测移动性。状态级时间序列数据是从从3月1日开始的各种开放式访问来源获得,从3月1日至6月13日,2020年6月13日,整个数据集被分成两部分以进行训练和测试。 Granger因果关系选择的变量用于通过普通的最小二乘回归,脊回归和套索回归算法培训三种不同的减少订单模型。最后,在测试数据上检查了开发模型的预测准确性。结果表明,包括新的Covid案件,社会疏散指数,人口的人口,居住在家里的人口,占外的百分比,不同的目的地,社会经济地位,在家中工作的人的百分比,以及州所有人关闭其他人是影响每日VMT的最重要因素。此外,在所有建模技术中,RIDGE回归提供了最常见错误的最优越的性能,而套索回归也比普通最小二乘模型更好。
translated by 谷歌翻译
COVID-19的大流行提出了对多个领域决策者的流行预测的重要性,从公共卫生到整个经济。虽然预测流行进展经常被概念化为类似于天气预测,但是它具有一些关键的差异,并且仍然是一项非平凡的任务。疾病的传播受到人类行为,病原体动态,天气和环境条件的多种混杂因素的影响。由于政府公共卫生和资助机构的倡议,捕获以前无法观察到的方面的丰富数据来源的可用性增加了研究的兴趣。这尤其是在“以数据为中心”的解决方案上进行的一系列工作,这些解决方案通过利用非传统数据源以及AI和机器学习的最新创新来增强我们的预测能力的潜力。这项调查研究了各种数据驱动的方法论和实践进步,并介绍了一个概念框架来导航它们。首先,我们列举了与流行病预测相关的大量流行病学数据集和新的数据流,捕获了各种因素,例如有症状的在线调查,零售和商业,流动性,基因组学数据等。接下来,我们将讨论关注最近基于数据驱动的统计和深度学习方法的方法和建模范式,以及将机械模型知识域知识与统计方法的有效性和灵活性相结合的新型混合模型类别。我们还讨论了这些预测系统的现实部署中出现的经验和挑战,包括预测信息。最后,我们重点介绍了整个预测管道中发现的一些挑战和开放问题。
translated by 谷歌翻译
2019年底,最新的新型冠状病毒SARS-COV-2成为了一项显着的急性呼吸系统疾病,已成为全球大流行病。由于国家和市政当局的高社会经济差异,巴西等国家难以处理病毒。因此,本研究提出了一种使用不同机器学习的新方法,以及应用于巴西Covid-19数据的深度学习算法。首先,使用聚类算法来识别具有相似社会阶乘行为的县,而Benford的定律用于检查数据操作。基于这些结果,我们能够根据群集正确地模拟Sarima模型以预测新的每日情况。无监督的机器学习技术优化了定义Sarima模型参数的过程。此框架也很有用来在所谓的第二波期间提出限制方案。我们已经使用了来自巴西最有人口的S \〜Ao Paulo State的645个县。然而,这种方法可以用于其他州或国家。本文展示了机器学习,深度学习,数据挖掘和统计数据的不同技术可以一起使用,以在处理大流行数据时产生重要结果。虽然结果不能专门用于评估和影响政策决策,但它们提供了已使用的无效措施的替代方案。
translated by 谷歌翻译
肥胖是一个重大的健康问题,增加了各种主要慢性病的风险,如糖尿病,癌症和中风。虽然通过横断面BMI录音识别的肥胖作用已经过分研究,但BMI轨迹的作用远远不大。在这项研究中,我们利用从大型和地理位置的EHR数据集中提取的BMI轨迹捕获大约200万个人的健康状况为期六年的健康状况。我们根据BMI轨迹定义九个新的可解释和基于证据的变量,以使用K-Means聚类方法将患者聚类为子组。我们在人口统计学,社会经济和生理测量变量方面彻底审查了每个集群特征,以指定簇中患者的不同性质。在我们的实验中,已被重新建立肥胖,高血压,阿尔茨海默和痴呆症的肥胖,高血压,阿尔茨海默氏症和痴呆症的直接关系,并且已经发现有几种慢性疾病的特异性特征的不同簇符合或与现有的知识体系互补。
translated by 谷歌翻译
Neglected tropical diseases (NTDs) continue to affect the livelihood of individuals in countries in the Southeast Asia and Western Pacific region. These diseases have been long existing and have caused devastating health problems and economic decline to people in low- and middle-income (developing) countries. An estimated 1.7 billion of the world's population suffer one or more NTDs annually, this puts approximately one in five individuals at risk for NTDs. In addition to health and social impact, NTDs inflict significant financial burden to patients, close relatives, and are responsible for billions of dollars lost in revenue from reduced labor productivity in developing countries alone. There is an urgent need to better improve the control and eradication or elimination efforts towards NTDs. This can be achieved by utilizing machine learning tools to better the surveillance, prediction and detection program, and combat NTDs through the discovery of new therapeutics against these pathogens. This review surveys the current application of machine learning tools for NTDs and the challenges to elevate the state-of-the-art of NTDs surveillance, management, and treatment.
translated by 谷歌翻译
社交媒体越来越多地用于大规模的人口预测,例如估计社区健康统计数据。但是,社交媒体用户通常不是预期人群的代表性样本 - “选择偏见”。在社会科学中,这种偏见通常是通过约束技术解决的,在这种偏见的情况下,根据其社会人口统计学群体的不足或过度采样,将观察结果重新恢复。然而,很少评估约束性以改善预测。在这项两部分的研究中,我们首先评估了标准“现成”的限制技术,发现它们在四个从Twitter中介绍美国县人口健康统计数据的四个任务中没有提供任何改进,甚至通常会退化预测准确性。降级表现的核心原因似乎与他们对每个人群社会人口统计学的稀疏或缩减估计的依赖有关。在研究的第二部分中,我们开发和评估了强大的阶段化后,该方法包括解决这些问题的三种方法:(1)估算器重新分布以说明缩小的缩小,以及(2)自适应式嵌套和(3)告知平滑为处理稀疏的社会人口统计学估计。我们表明,这些方法中的每一种都会导致预测准确性比标准限制方法显着改善。综上所述,强大的后阶段能够实现最先进的预测准确性,在调查的生活满意度的情况下,解释的方差(R^2)增加了53.0%,所有任务的平均平均值增加了17.8%。
translated by 谷歌翻译
近年来,美国经历了一个缺乏预定的药物过量死亡的阿片类药物。研究发现这种过量的死亡与邻域级特征有关,从而提供了识别有效干预的机会。通常,诸如普通的最小二乘(OLS)或最大似然估计(MLE)的技术用于记录邻域级因素,在解释这种不利结果时。然而,这些技术较低的是在混淆因素之间确定非线性关系。因此,在这项研究中,我们应用基于机器学习的技术,以识别特拉华州社区的阿片式风险,并探讨这些因素使用福芙添加剂解释(Shaf)的相关性。我们发现与社区环境有关的因素,随后受教育,然后犯罪,与较高的阿片类药物风险高度相关。多年来我们还探讨了这些相关性的变化,了解流行病的变化动态。此外,我们发现,随着近年来,由于疫情从法律(即,海洛因和芬太尼)药物从法律(即,海洛因和芬太尼)转移,与阿片类药风险的环境,犯罪和健康相关变量的相关性显着增加虽然经济和社会人口统计变量的相关性降低了。近年来,教育相关因素的相关性与近年来略有增加,表明需要提高对阿片类药物流行病的认识。
translated by 谷歌翻译
Importance: Social determinants of health (SDOH) are known to be associated with increased risk of suicidal behaviors, but few studies utilized SDOH from unstructured electronic health record (EHR) notes. Objective: To investigate associations between suicide and recent SDOH, identified using structured and unstructured data. Design: Nested case-control study. Setting: EHR data from the US Veterans Health Administration (VHA). Participants: 6,122,785 Veterans who received care in the US VHA between October 1, 2010, and September 30, 2015. Exposures: Occurrence of SDOH over a maximum span of two years compared with no occurrence of SDOH. Main Outcomes and Measures: Cases of suicide deaths were matched with 4 controls on birth year, cohort entry date, sex, and duration of follow-up. We developed an NLP system to extract SDOH from unstructured notes. Structured data, NLP on unstructured data, and combining them yielded seven, eight and nine SDOH respectively. Adjusted odds ratios (aORs) and 95% confidence intervals (CIs) were estimated using conditional logistic regression. Results: In our cohort, 8,821 Veterans committed suicide during 23,725,382 person-years of follow-up (incidence rate 37.18 /100,000 person-years). Our cohort was mostly male (92.23%) and white (76.99%). Across the six common SDOH as covariates, NLP-extracted SDOH, on average, covered 84.38% of all SDOH occurrences. All SDOH, measured by structured data and NLP, were significantly associated with increased risk of suicide. The SDOH with the largest effects was legal problems (aOR=2.67, 95% CI=2.46-2.89), followed by violence (aOR=2.26, 95% CI=2.11-2.43). NLP-extracted and structured SDOH were also associated with suicide. Conclusions and Relevance: NLP-extracted SDOH were always significantly associated with increased risk of suicide among Veterans, suggesting the potential of NLP in public health studies.
translated by 谷歌翻译
对于过去的几年来,冠状病毒通常被称为Covid-19,通过施加几年,通过施加几年,在美国居住在美国居住的所有公民的日常生活受到忽视。为了应对日益增长的恐惧和危险的Covid-19对美国的社会造成造成的,已经成为个人利用的常设补救措施。在本文中,我们研究了Covid-19疫苗和助推器之间的关系,以及美国多个州的冠状病毒的总案例计数。此外,本文讨论了几个,底层健康状况与Covid-19之间的关系。为了有效地讨论这些关系,本文将利用统计测试和机器学习方法进行分析和讨论。此外,本文反映了关于教育程度,种族和Covid-19之间关系的结论,以及可以以潜在的健康状况,疫苗接种率和Covid-19的总案例和死亡计数建立的可能连接。
translated by 谷歌翻译
近年来,骑车服务的越来越重要表明,有必要研究骑车需求的关键决定因素。然而,关于骑乘需求决定因素的非线性效应和空间异质性,知之甚少。这项研究采用了可解释的基于基础学习的分析框架,以确定塑造骑车需求并在各种空间环境(机场,市区和社区)探索其非线性关联的关键因素。我们在芝加哥使用骑车旅行数据进行实证分析。结果表明,建筑环境的重要性在空间环境中各不相同,并且在预测对机场旅行的乘车需求方面共同贡献了最大的重要性。此外,建筑环境对骑车需求的非线性影响显示出强烈的空间变化。骑车需求通常对市区旅行的建筑环境变化最有反应,然后进行邻里旅行和机场旅行。这些发现提供了运输专业人员的细微见解,以管理骑车服务。
translated by 谷歌翻译
医学中的机器学习利用了财富的医疗保健数据来提取知识,促进临床决策,最终改善护理。然而,在缺乏人口统计分集的数据集上培训的ML模型可以在适用于不足的人群时产生次优绩效(例如少数民族,社会经济地位较低),因此延续了健康差异。在这项研究中,我们评估了四种型分类,以预测高氯血症 - 一种经常由ICU人口中的侵袭性流体给药的条件 - 并将其在种族,性别和保险亚组中进行比较。我们观察到,除了基于实验室的患者的模型性能之外,还要添加社会决定因素特征。 40个模型 - 亚组中的40分,亚组测试产生了显着不同的AUC分数,提示在将ML模型应用于社会决定簇子组时的差异。我们敦促未来的研究人员设计主动调整潜在偏见的模型,并包括他们研究中的子组报告。
translated by 谷歌翻译
中国城乡地区建模差分应力表达可以更好地了解城市化对心理福祉的影响,在过去二十年中迅速发展的国家。本文研究了使用等级混合效应模型从329个县中超过65,000名用户在中国城乡压力的经验和表达的语言差异。我们分析了微博职位中的短语,题目主题和心理语言学的选择,提及压力,以更好地了解中国城乡社区心理压力的评价差异;然后我们将它们与盖子的大规模民意调查进行了比较。在控制社会经济和性别差异之后,我们发现农村社区倾向于表达情感和个人主题,如关系,健康和机会,而在城市地区的用户使用相对,时间和外部主题,如工作,政治和经济学。这些差异存在于对GDP和城市化的控制之外,表明在非常具体的环境中农村和城市居民之间的基本不同的生活方式,可以说是具有不同的压力来源。我们在盖洛普民意调查中找到了与城市化的身体,金融和社会健康的腐败趋势。
translated by 谷歌翻译
Building an accurate model of travel behaviour based on individuals' characteristics and built environment attributes is of importance for policy-making and transportation planning. Recent experiments with big data and Machine Learning (ML) algorithms toward a better travel behaviour analysis have mainly overlooked socially disadvantaged groups. Accordingly, in this study, we explore the travel behaviour responses of low-income individuals to transit investments in the Greater Toronto and Hamilton Area, Canada, using statistical and ML models. We first investigate how the model choice affects the prediction of transit use by the low-income group. This step includes comparing the predictive performance of traditional and ML algorithms and then evaluating a transit investment policy by contrasting the predicted activities and the spatial distribution of transit trips generated by vulnerable households after improving accessibility. We also empirically investigate the proposed transit investment by each algorithm and compare it with the city of Brampton's future transportation plan. While, unsurprisingly, the ML algorithms outperform classical models, there are still doubts about using them due to interpretability concerns. Hence, we adopt recent local and global model-agnostic interpretation tools to interpret how the model arrives at its predictions. Our findings reveal the great potential of ML algorithms for enhanced travel behaviour predictions for low-income strata without considerably sacrificing interpretability.
translated by 谷歌翻译