许多灾后和冲突地区没有足够的关于运输基础设施资产的数据,阻碍了移动性和重建。特别是,随着老化和劣化桥的数量增加,有必要量化它们的负载特性以便进行维护并防止故障。承载能力和设计负荷被认为是任何土木结构的主要方面。当挑战性问题缺乏专业知识时,人道考虑可能代价高昂且速度慢。在本文中,我们建议采用深度学习作为方法来估算人群来源图像的承载能力。新的卷积神经网络架构受到来自6000多个桥梁的数据的培训,这将有益于未来的研究和应用。我们处理数据集中的显着变化(例如,类间隔,图像完成,图像颜色)并量化它们对预测准确度,精度,召回和F1分数的影响。最后,通过将多类分类转换为二元分类来实现实际优化,以实现有前景的使用性能。
translated by 谷歌翻译
在新兴的纳米物联网(IoNT)中,信息将通过复杂和扩散的媒体以分子的形式嵌入和传播。一个主要的挑战在于信道响应的长尾性质导致符号间干扰(ISI),这会降低检测性能。如果信道未知,我们不能轻易实现传统的相干信道估计和消除,并且ISI的影响将是在本文中,我们开发了一种用于分子信号盲检测的新型高维非相干方案。我们通过组合利用信号的瞬态特征的不同非相干度量,在更高维度的空间中实现这一点。通过推导任何构造的高维非相干度量的理论误码率(BER),我们证明了更高的维数总是在相同的样本空间中实现更低的BER。然后,我们设计了一个利用了Thearzen的广义盲检测算法。近似及其概率神经网络(Parzen-PNN)检测信息比特。利用其快速收敛和并行实现的优点,我们提出的方案可以满足检测精度和实时计算的需要。数值模拟表明,与其他最先进的方法相比,我们提出的方案可以获得10dB的BER。
translated by 谷歌翻译
在本文中,我们考虑利用部分重叠信道(POC)的网状结构无人机(UAV)网络。对于无人机网络中的基因标记收集任务,我们的目标是通过限制传输功率和服务质量(QoS)来优化网络吞吐量。就高度移动和不断变化的无人机网络而言,不幸的是,大多数现有方法依赖于确定对动态环境易受攻击的信息,使系统性能降低。为了对抗UAVnetworks的动态拓扑和变化干扰,提出了一种鲁棒的分布式学习方案。我们引入不确定性来表征无人机节点之间的动态信道增益,然后用模糊数解释,而不是完美的信道状态信息(CSI)。我们在映射模糊空间中实现学习和决策过程,而不是传统观察空间,其中信道容量是一个明确的奖励。这允许系统通过在备用空间中进行优化来实现更加平稳和更强大的性能。为此,我们设计了一个模糊支付函数(FPF)来描述波动的可能性,POCs分配的问题被公式化为模糊支付游戏(FPG)。在模糊双矩阵博弈的有吸引力的辅助下,证明了模糊纳什均衡(FNE)在我们制定的FPG中的存在性。我们的鲁棒模糊学习算法可以通过偏差法达到均衡解。最后,提供数值模拟以证明我们的新方案优于现有方案的优点。
translated by 谷歌翻译
检测异常并发现驾驶信号是科学研究和工业实践的重要组成部分。通常,潜在的机制非常复杂,涉及隐藏的演化非线性动力学和噪声污染。当代表性物理模型和大型标记数据集不可用时,与大多数实际应用程序一样,依赖于模型的贝叶斯方法会产生误导性结果,并且大多数监督学习机器也无法可靠地解决复杂的演化系统。在这里,我们提出了一种无监督的机器学习方法,它在一个结构良好的函数空间中运行,通过由考夫曼算子确定的线性函数表示来捕获非线性动力学。这一突破利用了时间特征嵌入和随后重建动态的相空间表示,从而允许从整个轨迹中可靠地识别关键全局特征。这大大改善了常用的静态局部特征,这些特征是脆弱的过渡或噪声。由于其数据驱动的性质,我们的方法包括任何先前的模型和训练语料库。我们将我们方法的惊人准确性与生物学,医学和工程学中的三个不同且具有挑战性的问题进行对比。在所有情况下,它都优于现有的最先进的方法。作为一种新的无监督信息处理范例,它适用于普遍存在的非线性动力系统,这些系统只有很少的专业知识,可以无偏见地挖掘工作原理,或者在未标记的数据流中淹没的内在相关性。
translated by 谷歌翻译
零射击学习(ZSL)旨在通过从所见类中传递的知识来识别看不见的类。这通常通过利用由看见和未看到的类共享的语义特征空间(FS)(即属性或词向量)作为桥来实现。然而,由于训练(看到)和测试(看不见)数据的相互不相交,现有的ZSL方法容易且通常遭受域移位问题。为了解决这个问题,我们提出了一种名为AMS-SFE的新模型。它通过语义特征扩展来考虑流形结构的对齐。具体来说,我们建立了一个基于自动编码器的模型,以扩展语义特征,并将分解与从数据的视觉FS中提取的嵌入式流形联合起来。这是通过扩展语义特征来首次对齐这两个FS的尝试。大量实验表明,与其他现有方法相比,我们的模型性能得到了显着提高。
translated by 谷歌翻译
Human3.6M数据集中大规模标记3D姿势的可用性在推动静止图像的3D人体姿态估计算法中发挥了重要作用。我们观察到,该领域的最新创新主要集中在使用该数据集时明确解决泛化问题的新技术,因为该数据库是在人为主题和背景变化有限的高度控制的环境中构建的。尽管有这样的努力,我们可以证明目前的方法仍然容易出错,特别是在针对拍摄的图像进行测试时。在本文中,我们的目标是从不同的角度解决这个问题。我们提出了一种原则性的方法来生成高质量的3D姿势地面真实性,并与内部人员一起生成任何野外图像。我们通过首先设计一种新颖的立体灵感神经网络来直接将任何2D姿势映射到高质量3D对应物来实现这一点。然后,我们执行精心设计的几何搜索方案,以进一步细化关节。基于这个方案,我们建立了具有400,000个野外图像及其相应的3Dpose基础事实的大规模数据集。这使得能够训练高质量的神经网络模型,而无需专门的训练方案和辅助损失功能,其有利地抵抗最先进的3D姿势估计方法。我们还定量和定性地评估了我们模型的泛化能力。结果表明,我们的方法令人信服地优于以前的方法。我们公开提供数据集和代码。
translated by 谷歌翻译
基于端到端,自回归模型的TTS已经显示出优于传统的TTS的显着性能改进。然而,自回归模块训练受到暴露偏差或实际数据和预测数据的不同分布之间的不匹配的影响。虽然实际数据在培训中可用,但在测试中,只有预测数据可用于提供自回归模块。通过在训练中引入实际和生成的数据序列,我们可以减轻暴露偏差的影响。我们建议使用Generative Adversarial Network(GAN)以及教授强制训练的关键思想。 GAN中的鉴别器被联合训练以使真实数据和预测数据之间的差异均衡。在AB主观测试中,结果表明新方法优于标准转移学习,CMOS改进为0.1。句子水平可懂度测试显示病理学测试集显着改善.GAN训练的新模型也比基线更稳定,以产生更好的Tacotron输出比对。
translated by 谷歌翻译
可以直接从给定的字素或音素序列预测语音的端到端TTS已经表现出比传统TTS更好的性能。然而,其预测能力仍然受到训练数据的声学/语音覆盖的限制,通常受到训练集大小的约束。为了进一步提高发音,韵律和感知自然度的TTS质量,我们建议利用嵌入在句法解析树中的信息,其中句子的词组间/词语信息在多级树结构中组织。具体来说,研究了两个关键特征:短语结构和相邻词之间的关系。在三个测试集上测量的主观听力的实验结果表明,所提出的方法有效地提高了基线合成语音的发音清晰度,韵律和自然度。系统。
translated by 谷歌翻译
核磁共振(NMR)光谱学是化学和生物学中不可或缺的工具,但经常会遇到很长的实验时间。我们提出了利用深度学习和神经网络的概念验证,以便从有限的实验数据中重建高质量,可靠且非常快速的核磁共振谱。我们表明,神经网络训练可以仅使用合成的核磁共振信号来实现,这提升了对深度学习方法中通常需要的大量实际训练数据的禁止需求。
translated by 谷歌翻译
点击率预测是推荐系统中的一项重要任务,旨在估计用户点击给定项目的概率。最近,已经提出许多深度模型来学习原始特征的低阶和高阶特征交互。 。但是,由于有用的交互总是稀疏的,因此DNN很难在大量参数下有效地学习它们。在实际场景中,人工特征能够提高深度模型(例如广泛和深度学习)的性能,但是特征工程是昂贵的并且需要领域知识,使得它在不同场景中是不实际的。因此,有必要自动增强特征空间。在本文中,我们提出了一种新的卷积神经网络特征生成(FGCNN)模型,它具有两个组成部分:特征生成和深度分类器。特征生成利用CNN的强度生成局部模式并重新组合它们以生成新特征。深度分类器采用IPNN的结构来学习来自增强特征空间的交互。三个大尺度图的实验结果表明,FGCNN明显优于九种现有模型。此外,在将一些最先进的模型应用为DeepClassifier时,总能实现更好的性能,这表明我们的FGCNN模型具有很强的兼容性。这项工作探索了CTR预测的新方向:通过自动识别重要特征来减少DNN的学习困难是非常有用的。
translated by 谷歌翻译