深度学习推理加速器是从与Pthreads并行化的C语言软件程序合成的。软件实现使用着名的生产者/消费者模型,其中并行线程通过FIIFO队列互连。 LegUp高级综合(HLS)工具在并行FPGA硬件中合成线程,将软件并行性转换为空间并行性。生成一个完整的系统,在合成加速器中实现卷积,池化和填充,并在嵌入式ARM处理器上执行剩余任务。加速器结合了精确度降低,以及一种新的卷积零重量跳跃方法。在中型的英特尔Arria 10 SoC FPGA上,VGG-16的峰值性能为138有效GOPS。
translated by 谷歌翻译
我们提出了一种新的预测器组合算法,该算法基于潜在相关的参考预测器来改进给定的任务预测器。现有方法的局限性在于,为了发现潜在的任务依赖性,它们要么需要所有预测变量的已知参数形式,要么访问所有预测变量共同评估的单个固定数据集。为了克服这些限制,我们设计了一种新的非参数任务依赖性估计程序,该程序自动对齐不相交特征集的异构预测器的评估。我们的算法被实例化为一个强大的流形扩散过程,它共同改进了估计的预测分配和相应的任务依赖性。我们将该算法应用于相对属性排序问题,并证明它不仅扩展了预测器组合方法的应用范围,而且即使应用于经典预测器组合设置也优于现有方法。
translated by 谷歌翻译
这项工作涉及一个移动的目标,追逐在杂乱的环境中配备视觉传感器的飞行器的任务。与无障碍或稀疏环境相比,追踪者应该能够在飞行效率的同时进行手动和闭塞。为了通过实时重新计划来解决这些挑战,我们引入了一个指标Fortarget可见性并提出了一个级联追逐计划器。通过图搜索方法,我们首先生成一系列追逐走廊和路径,确保安全并优化可见性。在接下来的阶段,走廊和航路点被用作二次编程中的约束和客观,我们从中完成一个动态可行的追踪轨迹。该算法在多种密集环境中进行了测试。具有完整代码实现和GUI的模拟器AutoChaser可以在以下网址找到://github.com/icsl-Jeon/traj_gen_vis
translated by 谷歌翻译
在视觉监控系统中,有必要认识到人们处理诸如电话,杯子或塑料袋之类物体的行为。在本文中,为了解决这个问题,我们提出了一个新的框架,用于通过图形卷积网络使用人类和对象姿势识别与对象相关的人类行为。在此框架中,我们通过选择性地对视频中的信息帧进行采样来构建可靠人类的骨架图,其中包括在姿势估计中获得的具有高置信度分数的人类关节。从采样帧生成的骨架图表示与空间域和时域中的对象位置相关的人体姿势,并且这些图被用作图卷积网络的输入。通过开放基准和我们自己的数据集进行实验,我们验证了框架的有效性,因为我们的方法优于基于骨架的动作识别的最先进方法。
translated by 谷歌翻译
关于语境化词语表示问题的研究 - 用于句子理解的可重用神经网络组件的发展 - 最近出现了一系列进展,其中心是使用ELMo等方法进行语言建模的无监督预训练任务。本文提供了第一个大规模的系统研究,比较了该语境中不同的预训练任务,既作为语言建模的补充,也作为潜在的替代。该研究的主要结果支持使用语言模型作为预训练任务,并使用语言模型的多任务学习在可比模型中设置新的技术水平。然而,仔细观察这些结果可以发现令人担忧的强大基线和跨越目标任务的惊人变化的结果,这表明广泛使用的预训练和冻结句子编码器的范例可能不是进一步工作的理想平台。
translated by 谷歌翻译
机器人辅助治疗(RAT)已经成功地用于HRI研究,其中包括社交机器人在医疗保健干预中,因为它们能够吸引人类用户的社交和情感维度。该主题的研究项目遍布全球,遍及美国,欧洲和亚洲。所有这些项目都有一个雄心勃勃的目标,即增加无辜人口的福祉。 RAT的典型工作是使用遥控机器人进行的;一种名为Wizard of of Oz(WoZ)的技术。机器人通常由操作人员控制,患者不知道。然而,从长远来看,WoZ已被证明不是一种可持续发展的技术。为机器人提供自主权(同时保持在治疗师的监督下)有可能减轻治疗师的负担,不仅在治疗方面本身,而且在长期诊断任务中。因此,需要探索在治疗中使用的社交机器人的几个自治程度。增加机器人的自主权也可能带来一系列新的挑战。特别是,需要回答新的道德问题,即使用弱势群体的机器人,以及需要确保符合道德规范的机器人行为。因此,在本次研讨会中,我们希望收集研究结果并探索哪种程度的自主权可能有助于改善医疗保健干预措施,以及我们如何克服其固有的道德挑战。
translated by 谷歌翻译
我们提出了使用条件生成对抗网络(GAN)的视频压缩框架。我们依赖于两个编码器:一个用于部署标准视频编解码器,另一个用于通过下采样管道生成低级别地图,新设计的软边缘检测器和新型无损压缩方案。对于解码,我们使用标准视频解码器以及基于自然网络的解码器,其使用条件GAN进行训练。最近的“深度”视频压缩方法需要多个视频来预生成网络以进行插值。与此前的工作相反,我们的方案在从单个视频和相应的低级地图中获取的非常有限数量的关键帧对上训练生成解码器。训练的解码器产生依赖于低级地图的引导的重建帧,而没有任何插值。在一组不同的131个视频上进行的实验表明,我们提出的基于GAN的压缩引擎能够以比H.264或HEVC等主流标准代码更低的比特率实现更高质量的重建。
translated by 谷歌翻译
背景:使用计算机图像数据进行三维(3D)头部测量分析已被迅速用于畸形和人体测量学。为了克服传统头部测量学的局限性,已经提出了几种不同的自动3D注释方法。本研究的目的是评估我们新开发的系统使用加深学习算法进行自动3D头部测量注释的准确性。方法:为了克服当前的技术限制,开发了一些措施,直接注释3D人类头骨数据。我们基于深度学习的模型系统主要由3D卷积神经网络和图像数据采样组成。结果:计算三轴和三维距离中参考值和预测坐标值之间的差异,以评估系统精度。我们的新模型系统产生了3.26,3.18和4.81毫米(三轴)和7.61毫米(三维)的预测误差。此外,三组的地标之间没有区别,包括正中矢状面,水平面和下颌骨(p> 0.05)。结论:开发了一种基于三维卷积神经网络的三维脑电图自动标注系统。制定了用于实施该系统的策略,并评估了测量结果的准确性。该系统的进一步发展计划用于自动3D头部测量注释的全面临床应用。
translated by 谷歌翻译
在本文中,我们考虑在具有一个源,一个中继和一个目的地的多输入多输出(MIMO)解码转发(DF)中继信道中的信号检测算法。现有的次优近似似然(NML)检测器和具有两级成对错误概率(NMLw2PEP)检测器的NML通过源中继(SR)链路的瞬时信道状态信息(CSI)和具有统计CSI的优化性能实现了优异的性能。 SR链接,分别。然而,随着发射天线数量的增加,NML探测器需要具有指数级增加的复杂性。使用深度学习算法,提出了基于NML的检测网络(NMLDN),其具有和不具有SR链路的CSI。在使用大量随机分布的信道进行单次训练之后,NMLDN检测改变信道中的信号。检测网络需要比穷举搜索NML检测器低得多的检测复杂度,同时表现出良好的性能。为了评估性能,我们引入了基于NML检测器的多项式复杂度的半定松弛检测器。此外,提出了基于NML度量的零度的新线性检测器。在目的地(DetD)的中继(DetR)和检测算法中应用各种检测算法,我们在MIMO DF中继信道中提出了一些DetR-DetD方法。可以根据所需的错误概率和检测复杂度采用适当的DetR-DetD方法。复杂性分析和仿真结果验证了本文的论点。
translated by 谷歌翻译
基于深度学习的图像分割方法的最新进展已经具有人类精确度的实时性能。然而,偶尔最好的方法由于低图像质量,伪像或黑盒算法的意外行为而失败。能够在没有基础事实的情况下预测分割质量在临床实践中是至关重要的,但在大规模研究中也是如此,以避免在随后的分析中包含无效数据。在这项工作中,我们提出了两种使用深度学习进行心血管MR分割的实时自动质量控制方法。首先,在12,880个样本上对一个神经网络进行润湿,以便根据每个案例预测Dice相似系数(DSC)。我们报告1,610个测试样本的平均误差(MAE)为0.03,二元分类精度为97%,这反映了低质量和高质量的分割。其次,在没有手动注释数据可用的情况下,我们训练网络来预测通过反向测试策略获得的估计质量的DSC分数。对于这种情况,Wereport的MAE = 0.14和91%二进制分类精度。实时获得预测,当与实时分割方法结合时,能够在患者仍在扫描仪中时获得关于获取的扫描是否是可分析的即时反馈。这进一步使得优化图像采集的新应用朝向最佳可能的分析结果。
translated by 谷歌翻译