同声传译,将语言从一种语言翻译成另一种语言,是一项固有的困难和艰巨的任务。口译员面临的最大挑战之一是准确翻译难以理解的术语,如专有名称,数字或其他实体。智能计算机辅助口译(CAI)工具可以分析口头词并检测可能被口译员翻译的术语,可以减少翻译错误并提高口译员的表现。在本文中,我们提出了一个任务,即预测同义解释器将翻译哪些术语,并检查使用supervisedsequence标记符执行此任务的方法。我们描述了一些明确设计的任务特定功能,以指示解释器何时可能难以翻译单词.NAIST同时翻译语料库的新注释版本的实验结果(Shimizu et al。,2014)表明了我们提出的方法的前景。
translated by 谷歌翻译
现代机器翻译(MT)系统在干净的域内文本中表现良好。然而,人类生成的文本,特别是在社会媒体领域,充满了错别字,俚语,方言,惯用语和其他可能对输出翻译的准确性产生灾难性影响的噪音。在本文中,我们利用噪声文本的机器翻译(MTNT)数据集,通过在其他清洁数据中模拟自然发生的噪声来增强MT系统的稳健性。以这种方式合成噪声,我们最终能够使香草MT系统对自然产生的噪声具有弹性,并且部分地减轻由此产生的精度损失。
translated by 谷歌翻译
同声传译,实时翻译口语,是极具挑战性和体力要求的。预测解释信心和解释信息充分性的方法有许多潜在的应用,例如计算机辅助解释接口或教学工具。我们提出了通过建立现有的机器翻译输出质量评估(QE)方法来预测同时解释器性能的任务。在三个语言对中的五个设置的实验中,我们扩展了QE管道以估计解释器性能(由METEOR评估度量近似)并提出反映解释策略和评估措施的新颖特征,以进一步提高预测准确性。
translated by 谷歌翻译
强化学习中的参数化动作由具有连续动作参数的离散动作组成。这提供了一个解决复杂域的框架,需要将高级操作与灵活控制相结合。最近的P-DQN算法扩展了深度Q网络以学习超过空间。但是,它将所有动作参数视为Q网络的单个联合输入,使其理论基础无效。我们用这种方法分析问题,并提出一种新方法,多次通过深度Q网络或MP-DQN来解决这些问题。我们凭经验证明MP-DQN在平台,机器人足球目标和半场进攻域的数据效率和融合策略性能方面明显优于P-DQN和其他先前的算法。
translated by 谷歌翻译
最近的工作引入了一种简单的数值方法,用于求解具有深度神经网络(DNN)的偏微分方程(PDE)。本文对该方法进行了回顾和扩展,同时将其应用于分析数值偏微分方程和非线性分析中最基本的特征之一:irregularsolutions。首先,讨论,分析了可压缩欧拉方程的Sod激波管解决方案,然后与传统的有限元和有限体积方法进行了比较。扩展这些方法以考虑性能改进和同时参数空间探索。接下来,解决了可压缩磁流体动力学(MHD)的冲击解决方案,并将其用于利用实验数据来增强PDE系统的情况,该PDE系统不足以验证对观察/实验数据的验证。这是通过使用源项加强模型PDE系统并使用合成实验数据的监督训练来实现的。由此产生的PDE的DNN框架似乎表现出几乎非常简单的系统分型,大数据集的自然整合(无论是合成的实验),同时还能实现对整个参数空间的单遍探索。
translated by 谷歌翻译
人们越来越需要快速准确的方法来测试几种化学暴露源的发育神经毒性。目前的方法,例如体内动物研究,以及动物和人类原代细胞培养物的测定,遭受与人体生理学的时间,成本和适用性相关的挑战。我们以前使用从暴露于各种化合物的人类3D组织模型收集的基因表达数据来证明使用机器学习来预测发育神经毒性的成功。 3D模型在生物学上与开发神经结构相似,但其复杂性需要广泛的专业知识和努力才能使用。通过专注于构建发育神经毒性的测定,我们提出更简单的2D组织模型可能证明是足够的。因此,我们比较了训练对来自2D组织模型的数据的预测模型的准确性与对来自3D组织模型的数据进行训练,并且发现2D模型基本上更准确。此外,我们发现2D模型在严格的基因集选择下更加坚固,而3D模型则遭受了实质性的精确度降低。虽然这两种方法都有优点和缺点,但我们建议,在优先考虑神经毒性筛查时,我们描述的2D方法可能是决策者的有效工具。
translated by 谷歌翻译
本文提出了一种自动方法,用于获得摄像机和具有低至16个光束的3D激光雷达之间的外部校准参数。我们使用acheckerboard作为参考,以获得两个感应器帧中感兴趣的功能。通过利用板的几何形状,从激光雷达点云中自动提取校准板中心点和法向矢量。相机图像中的相应特征是从相机的固有矩阵获得的。我们解释了选择这些功能背后的原因,为什么它们比其他可能性更强大。为了获得最优的内在参数,我们选择遗传算法来解决高度非线性状态空间。在定义3D实验区域相对于激光雷达的边界以及真实的板尺寸之后,该过程是自动化的。此外,假设相机是固有校准的。我们的方法需要至少3个棋盘格姿势,并且通过使用真实世界和模拟特征评估我们的算法来证明校准准确性。
translated by 谷歌翻译
用于自动车辆导航的厘米级全局精确且一致的地图早已通过开放区域中的实时动态(RTK)-GPS实现。然而,在处理城市环境时,GPS将在城市峡谷,桥梁,隧道内和地下环境中经历多径和阻塞。在本文中,我们提出了通过GPS的战术整合和精确提取的地理参考高分辨率空中正交图像来有效地记录地理坐标系中的局部地图的策略。从移动的车辆获得的密集的激光雷达点向下投射到水平面,准确地记录并覆盖在空中正射影像上。稀疏,稳健和长期的杆状地标被用作连杆激光和航空图像感测的锚点,并且限制了无法直接测量和识别的剩余激光雷达点的空间不确定性。使用精确参考的航空影像作为地面实况,实现了15-75cm的绝对平均全球精度。这对于实现地面车辆传感器特征的融合具有重要意义,其具有提取的诸如交通和车道标记之类的动态图像的特征。对于合作传感来说,有一个无偏见且准确的全局参考也是有用的。实验结果表明了在大面积操作时地图的准确性和一致性。
translated by 谷歌翻译
坚固性和安全性是自动驾驶汽车实际应用的关键属性。任何自治系统最重要的组成部分之一是本地化。在过去的20年中,该领域取得了重大进展,引入了非常有效的算法形成,本地化和SLAM。其中许多算法为特定域提供了令人印象深刻的演示,但无法通过对操作环境的更改来可靠地运行。鲁棒性方面没有得到足够的关注,并且自驱动车辆应用的定位系统很少被评估其鲁棒性。在本文中,我们提出了新的度量,以有效地量化定位鲁棒性,有或没有准确的基础事实。实验结果全面分析了这些指标在众多众所周知的定位策略中的应用。
translated by 谷歌翻译
提出了一种由“自动机器学习”(AutoML)中的应用驱动的字符级卷积神经网络(CNN),对表格数据中的列进行了语义分类。包含一组基类的模拟数据首先用于学习一组初始权重。然后将来自CKAN存储库的手标记数据用于转移学习范例,以将初始权重添加到问题的更复杂表示(例如,包括更多类)。在这样做时,实际的数据缺陷被学习并且所处理的类集可以从具有减少的标记数据和计算能力要求的基础集扩展。结果显示了该方法在三个不同领域的有效性和灵活性:表格数据的语义分类,社交媒体帖子的年龄预测和电子邮件垃圾邮件分类。除了进一步证明自然语言处理(NLP)中转移学习的有效性之外,我们的实验还建议在没有额外元数据的情况下分析语言的语义结构 - 即网络结构,标题等 - 可以为类型分类,垃圾邮件分类和社交媒体年龄预测产生竞争准确性。我们提供了我们的开源工具包SIMON,它是用于建模的语义推理的首字母缩写,它以用户友好和可扩展/可并行的方式实现了这种方法。
translated by 谷歌翻译