有许多关于从深度神经网络(DNN)中提取瓶颈(BN)特征的研究,这些特征训练用于区分说话者,密码短语和三音素状态以改善文本相关说话者验证(TD-SV)的性能。但是,取得了一定的成功。最近的一项研究[1]提出了一种时间对比学习(TCL)概念,用于探索脑信号分类的大脑状态的平稳性。语音信号具有类似的非平稳性,并且TCL还具有不需要标记数据的优点。因此,我们提出了一种基于TCL的特征提取方法。该方法将训练数据集中的每个语音容差均匀地划分为预定义数量的多帧分段。话语中的每个片段对应于一个类,并且跨语言共享类标签。然后训练DNN以区分各类中的所有语音帧以利用语音的时间结构。此外,我们提出了一种基于分段的无监督聚类算法,以便为这些分段分配类别标签。在RedDots挑战数据库上进行TD-SV实验。使用从TD-SV评估集中排除的语音数据离线密码短语来训练TCL-DNN,因此可以将所述特征视为与短语无关的。我们比较了所提出的TCL瓶颈(BN)特征与短时间倒谱特征和从DNN识别扬声器,密码短语,说话者+密码短语以及标签和边界由三种不同自动生成的单声道提取的BN特征的性能。语音识别(ASR)系统。实验结果表明,所提出的TCL-BN优于自适应特征和说话人+通行短语判别BN特征,其性能与ASR导出的BN特征相当。此外,....
translated by 谷歌翻译
In this paper, we present a time-contrastive learning (TCL) based bottleneck (BN) feature extraction method for speech signals with an application to text-dependent (TD) speaker verification (SV). It is well-known that speech signals exhibit quasi-stationary behavior in and only in a short interval, and the TCL method aims to exploit this temporal structure. More specifically, it trains deep neural networks (DNNs) to discriminate temporal events obtained by uniformly segmenting speech signals, in contrast to existing DNN based BN feature extraction methods that train DNNs using labeled data to discriminate speakers or pass-phrases or phones or a combination of them. In the context of speaker verification, speech data of fixed pass-phrases are used for TCL-BN training, while the pass-phrases used for TCL-BN training are excluded from being used for SV, so that the learned features can be considered generic. The method is evaluated on the RedDots Challenge 2016 database. Experimental results show that TCL-BN is superior to the existing speaker and pass-phrase discriminant BN features and the Mel-frequency cepstral coefficient feature for text-dependent speaker verification.
translated by 谷歌翻译
本论文分为六章:引言,卡拉卡模型及其对依赖性分析的影响,Bhojpuri的LT资源,英语 - Bhojpuri SMT系统:实验,EB-SMT系统的评估和结论。第一章通过详细介绍研究的动机,研究方法和印度语现有MT相关工作的文献综述,介绍了这一博士研究。第二章论述了卡拉卡和卡拉卡模型的理论背景。与此同时,它涉及以前的相关工作。它还讨论了Karakamodel在NLP和依赖解析中的影响。它比较了Karaka依赖和通用依赖。它还简要介绍了在英语 - Bhojpuri语言对的SMT系统中实现这些模型。
translated by 谷歌翻译
深度神经网络已经被证明对于具有不可察觉的扰动而被破坏的对抗性输入图像表现出有趣的脆弱性。然而,大多数对抗性攻击假设对图像像素空间进行全局的细粒度控制。在本文中,我们考虑一个不同的设置:如果对手只能改变输入图像的特定属性会发生什么?这些会产生可能明显不同的输入,但仍然看起来很自然,足以欺骗分类器。我们提出了一种新方法,通过优化参数条件生成模型的范围空间上的特定对抗性损失来生成这种“语义”对抗性实例。我们演示了对面部图像训练的二元分类器的攻击的实现,并且表明存在这种自然的语义对抗性示例。我们评估了ourattack对合成和真实数据的有效性,并提出了详细的比较方法。我们用理论边界来补充我们的实证结果,这些理论边界证明了这种参数对抗性实例的存在。
translated by 谷歌翻译
我们提出了一种用于表面完成和使用生成模型修复3D形状的系统,该系统在局部补丁上学习。我们的方法使用基于高度图的局部补片的新编码,该局部补片使用低分辨率输入形状的3D网格四边形参数化。这为我们提供了足够数量的本地3D补丁来学习修复中等大小孔的生成模型。根据最近2D修复的进展,我们研究了基于线性字典的模型和基于卷积去噪自动编码器的模型,用于修复任务,并且显示我们的结果优于以前基于几何的表面修复方法。我们在合成形状和真实世界扫描上验证我们的方法。
translated by 谷歌翻译
全基因组关联研究(GWAS)的总结统计数据教导了数百万种遗传标记与数万种表型之间的因果关系。然而,潜在的生物学机制尚未得到阐明。我们可以在因果调解框架中实现对GWAS的必要解释,寻求在遗传和下游变量之间建立一组稀疏的介体,但存在一些挑战。与现有的强有力和不切实际的假设方法不同,我们在原则性的基于总结的因果推理框架中解决实际挑战。我们分析了从现实世界遗传数据生成的大量模拟中提出的方法。我们只展示了我们的方法可以准确地赎回因果基因,即使不知道实际的个体水平数据,尽管存在竞争的非因果轨迹。
translated by 谷歌翻译
本文介绍了2018版WATShared任务的印度语多语言任务的机器翻译(MT)系统的系统描述。在我们的实验中,我们(RGNLP团队)探索所有语言对的统计和神经方法。 (我们进一步对低资源环境下的两种方法的语言相关问题进行了广泛的比较。)我们的PBSMT模型在英语中的自动评估指标得分最高,分为泰卢固语,印地语,孟加拉语,泰米尔语部分的共享任务。
translated by 谷歌翻译
微流体装置用于控制和引导各种应用中的流动行为,特别是在医学诊断中。特别流行的微流体形式 - 称为惯性微流体流动模拟 - 涉及放置一系列支柱以可控制地将初始流场变形为期望的流场。惯性流动雕刻可以被正式地定义为反问题,其中人们识别一系列支柱(从有限的一组支柱中选择,替换,每个支柱产生特定的转换),其复合变换导致用户定义的期望转换。对于大多数此类问题的工程学而言,逆向问题通常在计算上难以处理,大多数传统方法都基于搜索和优化策略。在本文中,我们将这个反问题作为强化学习(RL)问题。我们培训DoubleDQN代理来学习这个环境。结果表明,使用DoubleDQN模型可以学习,成功频率在200,000集中达到90%,奖励收敛。虽然大部分结果是通过固定特定的目标流形状来解释学习问题而获得的,但我们稍后将演示如何将基于一个目标形状的代理的学习转移到另一个目标形状,即从另一个目标形状转移,从而对于通用设计的通用设计是有用的。流动的形状。
translated by 谷歌翻译
算法是高影响力决策的越来越常见的组成部分,越来越多的关于实验室环境中的对抗性例子的文献表明标准机器学习模型并不健全。这表明现实世界的系统也容易受到操纵或分类的影响,这尤其对金融服务中使用的机器学习模型提出了挑战。我们使用贷款等级分类问题来探索机器学习模型如何对用户报告的数据中的微小变化敏感,使用文献中记录的对抗性攻击和原始的特定于域的攻击。我们的工作表明,一个强大的优化算法可以为金融服务建立模型,这些模型对扰动进行了严格的分类。据我们所知,这是针对金融服务深度学习的对抗性攻击和防御的第一项研究。
translated by 谷歌翻译
对先进材料的需求导致了复杂的多组分合金或固溶合金的发展。这些材料具有显着的性能,如强度,韧性,延展性,电气和电子特性。这种材料系统的当前发展受到昂贵的实验和计算上要求的第一原理模拟的阻碍。原子模拟可以为这些材料系统中的属性提供合理的分析。然而,设计强大潜力的问题仍然存在。在本文中,我们探索了一种基于深度卷积神经网络的方法来开发这种复杂合金的原子势,以研究材料以获得对控制性能的深入了解。在目前的工作中,我们提出了一个细胞原子配置的体素表示,并设计了一个3D卷积神经网络,可以容忍原子的相互作用。我们的结果突出了3D卷积神经网络的性能及其在机器学习理论潜力方面的功效。我们还探讨了体素分辨率的作用,并提供了针对体素化实现的两种边界框方法的见解。
translated by 谷歌翻译