随着自动组件比例越来越多的新兴车辆系统提供了最佳控制的机会,以减轻交通拥堵和提高效率。最近有兴趣将深入增强学习(DRL)应用于这些非线性动力学系统,以自动设计有效的控制策略。尽管DRL是无模型的概念优势,但研究通常仍依赖于对特定车辆系统的艰苦训练设置。这是对各种车辆和机动性系统有效分析的关键挑战。为此,本文贡献了一种简化的用于车辆微仿真的方法,并以最少的手动设计发现了高性能控制策略。提出了一种可变的代理,多任务方法,以优化车辆部分观察到的马尔可夫决策过程。该方法在混合自治交通系统上进行了实验验证,该系统是自动化的。在六种不同的开放或封闭交通系统的所有配置中都可以观察到经验改进,通常比人类驾驶基线的15-60%。该研究揭示了许多紧急行为类似于缓解波浪,交通信号传导和坡道计量。最后,对新兴行为进行了分析,以产生可解释的控制策略,这些控制策略已通过学习的控制策略进行了验证。
translated by 谷歌翻译
人蛋白质组包含一个庞大的相互作用激酶和底物网络。即使某些激酶被证明是治疗靶标的非常有用的,但大多数仍在研究中。在这项工作中,我们提出了一种新颖的知识图表示方法,以预测研究研究的新型相互作用伙伴。我们的方法使用通过整合IPTMNET,蛋白质本体论,基因本体论和BIOKG的数据构建的磷蛋白知识图。通过在三元组上进行定向的随机步行,与修改后的Skipgram或CBOW模型一起进行定向的随机步行,从而学习了该知识图中激酶和底物的表示。然后,这些表示形式被用作监督分类模型的输入,以预测研究不细的激酶的新型相互作用。我们还提供了对预测相互作用的后预测分析和对磷酸蛋白质学知识图的消融研究,以了解对研究的激酶的生物学的见解。
translated by 谷歌翻译
自主的改进提供了许多域中积极成果的潜力,但保证了他们的安全部署是困难的。这项工作调查了人们如何智能地监督代理商,即使在表现担保是难以捉摸的情况下,即使性能保证也是如此达到一些安全性。激励研究问题是:在安全关键环境中,我们可以避免有必要始终有一台机器吗?本文正式化了这一“缩放监督”问题,并调查其在融入交通的自治车辆(AVS)的安全关键背景下。它提出了一种保守的,可达性的方法,以减少AVS人类主管的负担,这允许在此环境中建立高信任上限。通过深度加强学习学习序列和流量模拟分析,在数字上,AVS的组合可以在AV采用中进行监督时间。一个关键的外卖是,尽管存在AVS的不完美,但由于AVS部署了EN Masse,监督变得更具易行。虽然这项工作侧重于AVS,但可扩展的监督框架与更广泛的自主控制挑战阵列相关。
translated by 谷歌翻译
我们提出了一种无模型加强学习方法,用于控制模拟交通网络中的混合自主流量,通过交通的双向和四路交叉口。我们的方法利用多代理政策分解,其允许基于本地观测的分散控制进行任意数量的受控车辆。我们证明,即使没有奖励塑造,加强学习也会学会协调车辆以表现出交通信号的行为,实现近乎最佳的受控车辆的最佳吞吐量。在多任务学习和转移学习的帮助下,我们表明这种行为横跨流量率和交通网络的大小推广。我们的代码,型号和视频的结果可在https://github.com/zhongxiayan/mixed_autonomy_intersection获得。
translated by 谷歌翻译
近年来,美国经历了一个缺乏预定的药物过量死亡的阿片类药物。研究发现这种过量的死亡与邻域级特征有关,从而提供了识别有效干预的机会。通常,诸如普通的最小二乘(OLS)或最大似然估计(MLE)的技术用于记录邻域级因素,在解释这种不利结果时。然而,这些技术较低的是在混淆因素之间确定非线性关系。因此,在这项研究中,我们应用基于机器学习的技术,以识别特拉华州社区的阿片式风险,并探讨这些因素使用福芙添加剂解释(Shaf)的相关性。我们发现与社区环境有关的因素,随后受教育,然后犯罪,与较高的阿片类药物风险高度相关。多年来我们还探讨了这些相关性的变化,了解流行病的变化动态。此外,我们发现,随着近年来,由于疫情从法律(即,海洛因和芬太尼)药物从法律(即,海洛因和芬太尼)转移,与阿片类药风险的环境,犯罪和健康相关变量的相关性显着增加虽然经济和社会人口统计变量的相关性降低了。近年来,教育相关因素的相关性与近年来略有增加,表明需要提高对阿片类药物流行病的认识。
translated by 谷歌翻译
通过改善安全性,效率和移动性,自动车辆(AVS)的快速发展持有运输系统的巨大潜力。然而,通过AVS被采用的这些影响的进展尚不清楚。众多技术挑战是出于分析自治的部分采用:部分控制和观察,多车辆互动以及现实世界网络代表的纯粹场景的目标。本文研究了近期AV影响,研究了深度加强学习(RL)在低AV采用政权中克服了这些挑战的适用性。提出了一个模块化学习框架,它利用深rl来解决复杂的交通动态。模块组成用于捕获常见的交通现象(停止和转运交通拥堵,车道更改,交叉点)。在系统级速度方面,发现了学习的控制法则改善人类驾驶绩效,高达57%,只有4-7%的AVS。此外,在单线交通中,发现只有局部观察的小型神经网络控制规律消除了停止和转移的流量 - 超过所有已知的基于模型的控制器,以实现近乎最佳性能 - 并概括为OUT-分销交通密度。
translated by 谷歌翻译
由国家科学基金会(NSF)资助的DILPORT项目http://dialport.org/涵盖了一组工具和服务,旨在满足对话研究社区的需求。在六年的时间里,已经创建了几种产品,包括Dialport Portal和DialCrowd。本文描述了这些贡献,这些贡献将在Sigdial中进行演示,包括实施,先前的研究,相应的发现以及工具将继续可为社区免费提供的位置。
translated by 谷歌翻译
跨研究的可复制性是强大的模型评估标准,强调预测的普遍性。当训练跨研究的可复制预测模型时,至关重要的是分别合并和处理研究。我们研究了在研究中存在潜在异质性的情况下在研究中的潜在异质性之间的增强算法的增强算法,并比较了两种多研究的学习策略:1)合并所有研究并培训单个模型,以及2)多学生结合在每个研究中单独的模型,并结合产生的预测。在回归环境中,我们根据分析过渡点提供理论准则,以确定合并或合奏与线性学习者增强的合奏更有益。此外,我们表征了通过组件线性学习者提高估计误差的偏差差异分解。我们验证理论过渡点导致模拟,并说明如何指导合并与在乳腺癌基因表达数据应用中结合的决定。
translated by 谷歌翻译
本文探讨了培训来生成代码的大型语言模型(LLMS)可以极大地提高对基因编程(GP)应用程序的突变操作员的有效性。由于此类LLM受益于包括顺序更改和修改的训练数据,因此它们可以近似人类会做出的可能变化。为了强调通过大型模型(ELM)的这种进化的含义的广度,在主要实验ELM与MAP-ELITE结合产生了数十万个Python程序的功能示例,这些示例在Sodarace域中输出了在Sodarace域中运行AMBULE的机器人,原始LLM从未在预训练中见过。然后,这些示例有助于引导培训一种新的条件语言模型,该模型可以为特定地形输出合适的步行者。引导新模型可以在以前可用的零培训数据中为给定上下文中输出适当的工件的新模型具有对开放性,深度学习和增强学习的影响。在这里深入探讨了这些含义,以期激发榆树现在打开的新研究方向。
translated by 谷歌翻译
自闭症谱系障碍(ASD)是一种神经发育障碍,导致发生改变的行为,社会发展和通信模式。在过去几年中,自闭症患病率增加了两倍,现在有1分中有1个现在受到影响。鉴于传统诊断是一种冗长,劳动密集型的过程,已经对自动筛选自闭症的发展系统来说,已经提出了重大关注。韵律异常是自闭症的最明显的迹象,受影响的儿童展示言语特质,包括梯度,单调的语调,非典型音高和不规则语言压力模式。在这项工作中,我们展示了一套机器学习方法,以检测自闭症和神经典型(NT)儿童在家庭环境中捕获的自闭症语音音频中的自闭症。我们考虑了三种方法来检测儿童的自闭症语言:首先,在提取的音频特征(包括熔融频率跳跃系数)上培训的随机森林;二,卷积神经网络(CNNS)培训谱图;第三,微调Wav2Vec 2.0 - 基于最先进的基于变压器的ASR模型。我们在从斯坦福的猜测中培训我们的小说Todaset的小说数据集的分类器?移动游戏,一个应用程序,旨在在自然家庭环境中占有自闭症和神经典型的儿童的视频。随机森林分类器实现了70%的精度,微调Wav2Vec 2.0型号达到了77%的精度,CNN在将儿童的音频视为ASD或NT时,CNN可实现79%的准确性。我们的模型能够在具有不一致的录制质量选择的家庭音频剪辑上培训时预测自闭症状态,这可能更广泛地对现实世界的条件。这些结果表明,机器学习方法提供了在没有专门设备的语音中自动检测自闭症的承诺。
translated by 谷歌翻译