在实际系统中非常昂贵的问题是非常普遍的,因为一个适合的评估花费几个小时甚至几天。在过去的几十年中,替代辅助进化算法(SAEAs)已被广泛用于解决这一关键问题。然而,大多数研究的SAEA专注于解决问题,至少十倍的问题维度,这在许多非常昂贵的现实问题中是不可接受的。在本文中,我们使用Voronoidiagram来提高SAEA的性能,并提出一个新的框架,名为基于Voronoi的有效代理协助进化算法(VESAEA),用于解决非常昂贵的问题,其中优化预算在fitnessevaluations方面仅为5倍。问题的维度。在提议的框架中,Voronoi图将整个搜索空间划分为若几个子空间,然后本地搜索在一些可能的更好的子空间中运行。此外,为了权衡勘探和开发,该框架涉及通过组合一次性交叉验证和径向基函数替代模型而开发的全局搜索阶段。性能选择器旨在在全局和本地搜索阶段之间动态和自动切换搜索。各种基准问题的实证结果表明,所提出的框架显着优于具有极其有限的适应性评估的几种最先进的算法。此外,还进一步分析了Voronoi图的功效,结果表明它有可能优化非常昂贵的问题。
translated by 谷歌翻译
风格转移一直是计算机视觉和图形学中的一个重要课题。加蒂等人。首先证明由预先训练的VGG网络提取的深度特征代表图像的内容和样式特征,因此,可以通过特征空间中的优化来实现样式转移。黄等人。然后通过简单地对齐每个特征通道的均值和方差,表明实时任意样式转移可以发生变化。然而,在本文中,我们认为仅仅调整深度特征的全局统计数据并不总能保证良好的风格转移。相反,我们建议联合分析输入图像对并提取两者之间的共同/可交换的样式特征。此外,还开发了一种新的融合模式,用于在特征空间中结合内容和样式信息。定性和定量实验证明了我们的方法的优势。
translated by 谷歌翻译
在本文中,我们提出神经短语到短语机器翻译(NP $ ^ 2 $ MT)。我们的模型使用短语注意机制来发现解码器用来生成输出(目标)短语的相关输入(源)段。我们还设计了一种有效的动态编程算法来解码分段,这些分段允许比Huang等人现有的基于神经短语的机器翻译方法更快地训练模型。 (2018)。此外,我们的方法可以在解码期间自然地与外部短语词典集成。经验实验表明,我们的方法与基准数据集上的最新方法具有可比性。但是,当训练和测试数据来自不同的分布或域时,我们的方法表现更好。
translated by 谷歌翻译
路面状况评估对于确保其可用性至关重要,同时仍能提供最大的道路交通安全。本文介绍了一种嵌入无人机(UAV)的鲁棒立体视觉系统。首先将目标图像的透视图转换为参考视图,这不仅提高了视差精度,而且还提高了算法的计算复杂度。然后使用双边滤波器对从立体匹配产生的成本量进行滤波。后者已经被证明是完全连通的马尔可夫随机场模型的功能最小化问题的可行解决方案。最后,通过相对于滚动角和视差投影模型最小化能量函数来变换视差图。这使得受损的道路区域与道路表面更加不同。所提出的系统在具有CUDA的NVIDIA Jetson TX2 GPU上实现以用于实时目的。通过实验证明,可以容易地将受损的道路区域与变换的视差图区分开。
translated by 谷歌翻译
Clinical notes contain information about patients that goes beyond structured data like lab values and medications. However, clinical notes have been underused relative to structured data, because notes are high-dimensional and sparse. This work develops and evaluates representations of clinical notes using bidirectional transformers (ClinicalBert). Clini-calBert uncovers high-quality relationships between medical concepts as judged by humans. ClinicalBert outperforms baselines on 30-day hospital readmission prediction using both discharge summaries and the first few days of notes in the intensive care unit. Code and model parameters are available. 1
translated by 谷歌翻译
为全世界95%以上的资源提供大量用于训练ASR系统的注释语音数据仍然很困难。然而,我们注意到人类婴儿开始通过少量示例词的声音(或语音结构)来学习语言,并且在没有听到大量数据的情况下将这些知识“概括”为其他词语。我们在这方面开展了一些初步工作。音频Word2Vec用于从口语(信号段)学习语音结构,而另一个自动编码器用于从文本词中学习语音结构。上述两者之间的关系可以在上述两个训练有素之后共同学习。这种关系可用于具有非常低资源的语音识别。在对TIMMIT数据集的初步实验中,只有2.1小时的语音数据(其中2500个口语单词被注释,其余未标记)的单词错误率为44.6%,如果4.1小时的语音数据,这个数字可以减少到34.2%(其中有20000个口语被注释)。这些结果并不令人满意,但是起点很好。
translated by 谷歌翻译
核磁共振(NMR)光谱学是化学和生物学中不可或缺的工具,但经常会遇到很长的实验时间。我们提出了利用深度学习和神经网络的概念验证,以便从有限的实验数据中重建高质量,可靠且非常快速的核磁共振谱。我们表明,神经网络训练可以仅使用合成的核磁共振信号来实现,这提升了对深度学习方法中通常需要的大量实际训练数据的禁止需求。
translated by 谷歌翻译
中文分词和依赖解析是中文自然语言处理的两个基本任务。依赖性解析是在字级上定义的,因此字分割是依赖性分析的前提条件,这使得依赖性解析受到错误传播的影响。在本文中,我们提出了一个统一的模型来集成中文分词和依赖解析。与以前的联合模型不同,我们提出的模型是基于图形的模型,更简洁,从而减少了特征工程的工作量。我们的联合模型比以前的联合模型具有更好的性能。我们的联合模型在中文字分割和依赖解析中实现了最先进的结果。
translated by 谷歌翻译
虽然嵌入式FPGA因其低延迟和高能效而成为DNN加速设备的有吸引力的平台,但边缘规模FPGA器件的资源稀缺也使得它对DNN部署具有挑战性。在本文中,我们提出了一种同时具有自下而上和自上而下方法的FPGA / DNN协同设计方法:面向自下而上硬件的DNN模型搜索高精度,以及自上而下的FPGA加速器设计,考虑DNN特定的特性。我们还构建了自动协同设计流程,包括用于执行面向硬件的DNN模型搜索的Auto-DNN引擎,以及用于为探索的DNN生成FPGA加速器的可合成C代码的Auto-HLS引擎。我们使用PYNQ-Z1 FPGA演示了对象检测任务的协同设计方法。结果表明我们提出的DNN模型和加速器在所有方面都优于最先进的FPGA设计,包括交叉联盟(IoU)(高6.2%),每秒帧数(FPS)(高2.48倍),功耗(降低40%)和能源效率(高2.5倍)。与基于GPU的解决方案相比,我们的设计提供了类似的精度,但消耗的能源却少得多。
translated by 谷歌翻译
草绘和自然语言是交互式应用的有效通信媒体。我们介绍Sketchforme,这是第一个基于网络的神经系统,可以根据用户指定的文本描述生成草图。 Sketchforme能够获得对多对象草绘场景的高水平低级理解,而无需在使用文本描述注释的草绘场景数据集上进行训练。由Sketchforme组成的剪贴画具有表现力和现实性:我们在用户研究中表明,这些草图在多种情况下比人类生成的草图更能传达描述,36.5%的草图被认为是人类生成的。我们使用这些生成的草图开发了多个交互式应用程序,并表明Sketchforme可以显着改进语言学习应用程序并支持基于智能语言的草图提供者。
translated by 谷歌翻译