深度学习推理加速器是从与Pthreads并行化的C语言软件程序合成的。软件实现使用着名的生产者/消费者模型,其中并行线程通过FIIFO队列互连。 LegUp高级综合(HLS)工具在并行FPGA硬件中合成线程,将软件并行性转换为空间并行性。生成一个完整的系统,在合成加速器中实现卷积,池化和填充,并在嵌入式ARM处理器上执行剩余任务。加速器结合了精确度降低,以及一种新的卷积零重量跳跃方法。在中型的英特尔Arria 10 SoC FPGA上,VGG-16的峰值性能为138有效GOPS。
translated by 谷歌翻译
我们考虑用于表示车辆动力学的神经网络的在线适应问题。神经网络模型旨在由MPC控制法使用以自主地控制车辆。这个问题具有挑战性,因为输入和目标分布都是非平稳的,而在线适应的天真方法会导致灾难性的遗忘,从而导致控制器故障。我们提出了一种新颖的在线学习方法,它将伪排练方法与局部加权投影回归相结合。我们证明了在模拟中使用局部加权投影回归伪排练(LW-PR $ ^ 2 $)方法的有效性以及使用1/5比例自动驾驶车辆收集的大型真实世界数据集。
translated by 谷歌翻译
相似性搜索是用于地震信号处理的流行技术,具有模板匹配,匹配滤波器和子空间检测器,用于各种各样的任务,包括信号检测和源识别。传统上,这些技术依赖于互相关函数作为测量相似性的基础。不幸的是,地震相关性受路径效应的支配,基本上需要沿着每条路径检测不同的波形模板。为了解决这个限制,我们定义了地震图相似性的路径不变量度量。具有三重损失函数的深度卷积神经网络将原始地震图映射到低维嵌入空间,其中空间的接近度对应于源函数的接近度,而不管路径或记录仪器。这种与路径无关的嵌入空间代表了地震图的新表现形式,其特征在于强大的源特定特征。用于训练和测试算法的数据集主要来自USArray实验,这是一个由400个地震仪组成的临时网络,从2007年到2012年在美国的2000多个地点部署。第一个四年(2006年,2007年,2008年,2009年)被选中作为训练集,并选择以下两年(2010年,2011年)进行验证和测试。训练,验证和测试集分别包含24,811,5,711和4,214个地震图。我们新颖的嵌入空间表示的效用在三个常见的地震任务中进行评估:事件关联,信号检测和源识别,分别达到80%,92%和90%的准确度,同时最小化所需的模板波形数量。
translated by 谷歌翻译
血糖(SMBG)和连续血糖监测(CGM)的自我监测通常被1型糖尿病(T1D)患者用于测量葡萄糖浓度。所提出的自适应基础推注算法(ABBA)支持来自SMBG或CGM设备的输入,以基于前一天患者的葡萄糖水平提供针对每日基础速率和餐时胰岛素剂量的个性化建议。 ABBA基于强化学习(RL),一种人工智能,并在计算机上验证了具有100个成年人的FDA接受人群,在三个模拟月份的不同现实情景下。这些情景包括每天三顿主餐和一小时零食,以及胰岛素敏感性,进餐时间,碳水化合物量和葡萄糖测量时间的不同变化和不确定性。结果表明,所提出的方法与CGM或SMBG作为输入信号实现了相当的性能,而不影响总的每日胰岛素剂量。结果是一个有希望的迹象,AI算法方法可以提供个性化的自适应胰岛素优化和实现葡萄糖控制 - 独立于葡萄糖监测技术的类型。
translated by 谷歌翻译
对人机协作或人机协作的研究主要集中在理解和促进单个机器人与单个人之间的协作上。将人机协作研究扩展到二元范围之外,提出了一个新的问题,即机器人应该如何分配集团成员的资源以及分布的社会和任务相关后果。需要方法上的进步才能让研究人员收集涉及多人的人体机器人协作数据。本文介绍了塔式建设,这是一项新的资源分配任务,允许研究人员检查机器人与人群之间的协作。通过关注机器人是否以及如何分配资源(建筑任务所需的木块)影响协作动力学和结果的问题,我们提供了一个案例,说明如何将该任务应用于实验室研究中,有124名参与者收集有关人体机器人协作的数据涉及多个人。我们强调任务可以产生的各种洞察力。特别是我们发现资源的分配会影响对人类成员之间的表现和人际交往的感知。
translated by 谷歌翻译
在本文中,我们提出了一个框架,用于结合基于深度学习的道路检测,粒子滤波器和模型预测控制(MPC),只使用单目相机,IMU和车轮速度传感器。该框架使用结合LSTM的深度卷积神经网络来学习车辆前方轨道的本地成本图表示。 Aparticle过滤器使用此动态观察模型在原理图中进行定位,并使用MPC积极地使用此基于粒子过滤器的状态估计进行驱动。我们展示了广泛的真实世界测试结果,并证明了车辆在复杂的污垢轨道上的摩擦极限下的可靠运行。我们使用我们的1:5比例测试车,在长达105英尺(32米)的泥路上达到27英里/小时(12米/秒)以上的速度。
translated by 谷歌翻译
使用医疗数据进行深度学习通常需要比单个提供者更大的样本量。虽然机构之间的数据共享需要培训更准确和更复杂的模型,但由于数据的敏感性,它可能导致严重的隐私问题。这个问题激发了许多关于神经网络分布式训练的研究,这些研究不需要直接共享训练数据。然而,简单的分布式培训不能提供可证明的隐私保证以满足技术安全标准,并且可以揭示关于潜在患者的信息。我们提出了一种在差分隐私下以分布式方式训练临床数据的神经网络的方法。我们在两个数据集上演示了这些方法,其中包括来自多个独立站点的信息,即eICU协作研究数据库和癌症基因组图谱。
translated by 谷歌翻译
我们提出了一种基于学习的方法来估计来自有限数量样本的amultisinusoidal信号的频谱。训练神经网络以近似模拟数据上的这些信号的频谱。所提出的方法非常灵活:适应不同的信号和噪声模型只需要相应地修改训练数据。数值实验表明,该方法与在一系列噪声水平下针对加性高斯噪声设计的经典方法具有竞争性,并且在存在脉冲噪声的情况下也是有效的。
translated by 谷歌翻译
生物医学关联研究越来越多地使用临床概念,特别是来自临床数据库的诊断代码作为表型。临床概念可以使用单词嵌入模型在有意义的向量空间中表示。这些嵌入允许比较临床概念或直接输入机器学习模型。使用传统方法,良好的表示需要高维度,使得可视化等下游任务更加困难。我们将一个二维双曲空间中的Popincar嵌入应用到一个大规模的行政索赔数据库中,并显示出与欧几里德空间中的100维嵌入相当的性能。然后,我们检查不同疾病背景下的疾病关系,以更好地了解潜在的表型。
translated by 谷歌翻译
资格跟踪是一种有效的技术,通过顺利地为最近访问的州分配信贷来加速加强学习。然而,他们的在线实现与现代深度强化学习算法不兼容,后者严重依赖于i.i.d.培训数据和离线学习。我们利用一种有效的递归方法来离线计算{\ lambda} -returns,它可以提供任何价值估计或演员批评方法的资格追踪的好处。我们演示了如何将我们的方法与DQN,DRQN和A3C结合使用,以便在玩Atari 2600游戏时大大提高这些算法的学习速度,即使在部分可观察性下也是如此。我们的结果表明Seaquest和Q * bert的样本效率提高了数倍。我们期望此处未考虑的算法和域的类似结果,包括具有连续反应的那些。
translated by 谷歌翻译