现代机器翻译(MT)系统在干净的域内文本中表现良好。然而,人类生成的文本,特别是在社会媒体领域,充满了错别字,俚语,方言,惯用语和其他可能对输出翻译的准确性产生灾难性影响的噪音。在本文中,我们利用噪声文本的机器翻译(MTNT)数据集,通过在其他清洁数据中模拟自然发生的噪声来增强MT系统的稳健性。以这种方式合成噪声,我们最终能够使香草MT系统对自然产生的噪声具有弹性,并且部分地减轻由此产生的精度损失。
translated by 谷歌翻译
我们提出了一种新的框架,用于学习可稳定的非线性动力系统,用于机器人中的连续控制任务。关键思想是开发一种新的控制理论正则化器,用于动态拟合,其根植于可稳定性的概念,这保证了学习系统可以伴随着能够稳定系统可以生成的任何轨迹的鲁棒控制器。通过利用收缩理论,统计学习和凸优化的工具,我们提供了一种通用且易处理的算法来学习可稳定的动力学,这可以应用于复杂的欠驱动系统。我们在模拟平面四旋翼系统上验证所提出的算法并观察控制 - 理论正则化动力学模型能够共同生成并准确地跟踪参考轨迹,而使用标准回归技术学习模型,例如,岭回归(RR)在两个任务上都做得非常差。此外,在具有高速度和倾斜角度的激进飞行状态下,跟踪控制器不能稳定由脊形正则化模型产生的轨迹,而使用控制理论学习模型观察到不存在,即使有少量演示示例。结果表明,需要注入基于标准模型的强化学习算法,并采用非线性控制理论提取的概念,以提高可靠性。
translated by 谷歌翻译
我们提出了一个具有视觉注意力的神经传感器模型,该模型学习了在给定其图像的情况下生成真实世界数学公式的LaTeX标记。应用序列建模和转换技术,这些技术非常成功,如自然语言,图像,手写,语音和音频等。我们构建了一个图像到标记模型,该模型学习生成语法和语义上超过150个字长的LaTeX标记代码,并获得89%的BLEU分数;改进了Im2Latex问题的先前技术水平。我们还通过热图可视化演示了如何有效地解释模型,并且可以准确地精确定位(检测和定位)图像上的符号,尽管在没有任何边界框数据的情况下进行了训练。
translated by 谷歌翻译
我们研究了具有对抗性扰动的线性动力系统的控制(与统计噪声相反)。我们考虑的目标是遗憾:我们希望在线控制程序几乎可以完成与完全了解后方干扰相关的程序。我们的主要结果是一个有效的算法,为这个问题提供了近乎严格的限制。从技术角度来看,这项工作在以前的工作中主要集中在两个主要方面:我们的模型允许动力学中的有源噪声,并允许一般的凸成本。
translated by 谷歌翻译
由于众多公司和组织在今天比比皆是,因此从众多公司和组织中选择一个是一项艰巨而繁琐的任务。尽管有许多可用的度量标准对公司进行排名,但是对于考虑了公司员工意见的不同方面的广义度量标准存在固有的需求。在这项工作中,我们的目标是通过研究公司的可靠员工评论来生成基于方面情感的嵌入来克服上述问题。我们从着名的网站Glassdoor.comand创建了公司评论的综合数据集,采用了一种新颖的集合方法来执行方面级别的情感分析。虽然已经针对电影,音乐等主题的评论进行了相关的工作,但这项工作是第一次。我们还提供了整理嵌入的一些见解,从而帮助用户更好地了解他们的选择,以及选择使用自定义偏好的公司。
translated by 谷歌翻译
预测资产的方向一直是一个活跃的研究领域和艰巨的任务。机器学习模型已被用于构建可靠的模型以模拟上述任务。集合方法是其中一种显示比单一监督方法更好的结果。在本文中,我们使用生成和判别分类器来创建堆栈,特别是3个生成和9个判别分类器,并优化单层神经网络来模拟价格加密货币的方向。使用的特征是使用的技术指标不仅限于趋势,动量,数量,波动率指标,而且情绪分析也被用于获得与上述特征相结合的有用见解。对于交叉验证,已使用Purged Walk向前交叉验证。在准确性方面,我们对集成方法与Stacking和Ensemble方法的混合性能进行了比较分析。我们还开发了一种对堆叠模型的组合特征重要性的方法。还根据特征重要性确定了重要指标。
translated by 谷歌翻译
我们使用相关聚类(CC)来解决图像分割的图分割问题,我们将其视为整数线性程序(ILP)。我们在ILP中重新构造优化,以便通过运算研究中的经典技术Benders分解进行有效优化。 OurBenders分解公式有许多子问题,每个子问题都与CC实例图中的阳极相关联,并行求解。每个Benderssubproblem强制执行与CC实例中其对应节点附加的负加权相对应的循环不等式。除了标准的Benders行之外,我们还生成了Maagnanti-Wong Benders行,以加速优化。我们的Benders分解方法为加速CC的优化提供了一个很有前途的新途径,并允许大规模并行化。
translated by 谷歌翻译
在本文中,我们提出使用多个局部二值模式(LBP)来有效地对土地利用图像进行分类。我们使用UC Merced 21类土地用途图像数据集。任务对于分类具有挑战性,因为数据集包含类可变性和类间相似性。我们提出的使用多邻域LBP结合最近邻分类器的方法能够达到77.76%的准确率。进行进一步的分类分析,并提出适当的建议以进一步改进分类准确性。
translated by 谷歌翻译
Twitter最近在危机期间被用于与官员沟通并实时提供救援和救援行动。事件的地理位置信息以及用户在这些场景中至关重要。地理位置的识别是具有挑战性的任务之一,因为位置信息字段(例如用户位置和推文的地名)不可靠。从tweettext中提取位置信息很困难,因为它包含许多非标准的英语,语法错误,拼写错误,非标准缩写等等。本研究旨在使用基于卷积神经网络(CNN)的模型提取推文中使用的位置词。我们与地震相关的推文达到了0.929的准确匹配分数,汉明损失0.002和$ F_1 $ -score 0.96。我们的模型能够提取甚至三到四个字的长期位置参考,这也可以从超过92%的精确匹配得分中看出。本文的研究结果有助于早期事件本地化,紧急情况,实时道路交通管理,本地化广告以及各种基于位置的服务。
translated by 谷歌翻译
在道路交通中对车辆进行分类和计数在运输工程领域中具有许多应用。然而,各种各样的车辆(两轮车,三轮车,汽车,公共汽车,卡车等)在没有任何车道纪律的情况下在发展区域的道路上行驶,使得车辆分类和计数成为自动化的难题。在本文中,我们使用最先进的基于卷积神经网络(CNN)的物体检测模型,并使用来自德里道路的数据对多个车辆类进行训练。我们使用来自四个不同位置的5562个视频帧获得高达75%的MAPon 80-20列车测试分割。由于发展中地区的强大网络连接在从道路到云服务器的连续视频传输中很少,我们还评估了基于CNN模型的嵌入式实现的延迟,能量和硬件成本。
translated by 谷歌翻译