在新兴的纳米物联网(IoNT)中,信息将通过复杂和扩散的媒体以分子的形式嵌入和传播。一个主要的挑战在于信道响应的长尾性质导致符号间干扰(ISI),这会降低检测性能。如果信道未知,我们不能轻易实现传统的相干信道估计和消除,并且ISI的影响将是在本文中,我们开发了一种用于分子信号盲检测的新型高维非相干方案。我们通过组合利用信号的瞬态特征的不同非相干度量,在更高维度的空间中实现这一点。通过推导任何构造的高维非相干度量的理论误码率(BER),我们证明了更高的维数总是在相同的样本空间中实现更低的BER。然后,我们设计了一个利用了Thearzen的广义盲检测算法。近似及其概率神经网络(Parzen-PNN)检测信息比特。利用其快速收敛和并行实现的优点,我们提出的方案可以满足检测精度和实时计算的需要。数值模拟表明,与其他最先进的方法相比,我们提出的方案可以获得10dB的BER。
translated by 谷歌翻译
在本文中,我们考虑利用部分重叠信道(POC)的网状结构无人机(UAV)网络。对于无人机网络中的基因标记收集任务,我们的目标是通过限制传输功率和服务质量(QoS)来优化网络吞吐量。就高度移动和不断变化的无人机网络而言,不幸的是,大多数现有方法依赖于确定对动态环境易受攻击的信息,使系统性能降低。为了对抗UAVnetworks的动态拓扑和变化干扰,提出了一种鲁棒的分布式学习方案。我们引入不确定性来表征无人机节点之间的动态信道增益,然后用模糊数解释,而不是完美的信道状态信息(CSI)。我们在映射模糊空间中实现学习和决策过程,而不是传统观察空间,其中信道容量是一个明确的奖励。这允许系统通过在备用空间中进行优化来实现更加平稳和更强大的性能。为此,我们设计了一个模糊支付函数(FPF)来描述波动的可能性,POCs分配的问题被公式化为模糊支付游戏(FPG)。在模糊双矩阵博弈的有吸引力的辅助下,证明了模糊纳什均衡(FNE)在我们制定的FPG中的存在性。我们的鲁棒模糊学习算法可以通过偏差法达到均衡解。最后,提供数值模拟以证明我们的新方案优于现有方案的优点。
translated by 谷歌翻译
检测异常并发现驾驶信号是科学研究和工业实践的重要组成部分。通常,潜在的机制非常复杂,涉及隐藏的演化非线性动力学和噪声污染。当代表性物理模型和大型标记数据集不可用时,与大多数实际应用程序一样,依赖于模型的贝叶斯方法会产生误导性结果,并且大多数监督学习机器也无法可靠地解决复杂的演化系统。在这里,我们提出了一种无监督的机器学习方法,它在一个结构良好的函数空间中运行,通过由考夫曼算子确定的线性函数表示来捕获非线性动力学。这一突破利用了时间特征嵌入和随后重建动态的相空间表示,从而允许从整个轨迹中可靠地识别关键全局特征。这大大改善了常用的静态局部特征,这些特征是脆弱的过渡或噪声。由于其数据驱动的性质,我们的方法包括任何先前的模型和训练语料库。我们将我们方法的惊人准确性与生物学,医学和工程学中的三个不同且具有挑战性的问题进行对比。在所有情况下,它都优于现有的最先进的方法。作为一种新的无监督信息处理范例,它适用于普遍存在的非线性动力系统,这些系统只有很少的专业知识,可以无偏见地挖掘工作原理,或者在未标记的数据流中淹没的内在相关性。
translated by 谷歌翻译
虽然无监督变分自动编码器(VAE)已经成为神经图像分析中的一个强大工具,但它们在监督学习中的应用正在探索中。我们的目标是通过提出统一的概率模型来弥补这一差距,以便学习成像数据的潜在空间并进行监督回归。基于学习解缠表示的最新进展,新的生成过程明确地模拟了关于回归目标变量的关于表示的条件分布。在该模型上执行变分推理过程导致VAE和神经网络回归之间的联合调节。在预测来自其结构磁共振(MR)图像的245名受试者的年龄时,当应用于感兴趣区域(ROI)测量或原始3D体积图像时,我们的模型比现有技术方法更准确。更重要的是,与简单的前馈神经网络不同,潜在表征中的年龄解开允许直观地解释人类大脑的结构发展模式。
translated by 谷歌翻译
深度神经网络是根据许多交替排列的线性和非线性变换的信号的多层映射的参数化。线性变换通常用于连接层和卷积层,包含大多数训练和存储的变分参数。压缩深度神经网络以减少其变化参数的数量而不是其预测能力是一个重要但具有挑战性的问题,即在有效地训练这些参数和降低过度拟合的风险方面建立优化方案。在这里,我们表明通过使用矩阵乘积算子(MPO)表示线性变换可以有效地解决这个问题。我们在五个主要的神经网络中测试了这种方法,包括FC2,LeNet-5,VGG,ResNet和DenseNet两个广泛使用的数据集,即MNIST和CIFAR-10,并且发现这个MPO表示确实在输入之间建立了忠实和有效的映射。和输出信号,可以显着减少参数数量,从而保持甚至提高预测精度。
translated by 谷歌翻译
自动驾驶是一个具有挑战性的多智能体领域,需要优化复杂的,混合的合作竞争互动。学习排除其他车辆轨迹上的偶然分布可以简化问题,通过轨迹优化和动态约束来实现近似解。我们采用基于模型的预测方法,以便使用车辆运动学的结构化先验知识,以及其他驾驶员计划轨迹以最小化未知成本函数的假设。我们引入了一种新颖的逆最优控制(IOC)算法,以在基于能量的生成模型中学习其他车辆的成本函数。 LangevinSampling是一种基于蒙特卡罗的采样算法,用于直接对控制序列进行采样。我们的算法比standardIOC方法提供更大的灵活性,并且可以学习在整个轨迹上定义的更高级别的非马尔可夫成本函数。我们利用神经网络扩展基于加权特征的成本函数,以获得NN增强的成本函数,这些函数结合了基于模型和无模型学习的优点。结果表明,基于模型的IOC可以实现最先进的车辆轨迹预测精度,并自然地考虑场景信息。
translated by 谷歌翻译
准确预测其他人的轨迹对于自动驾驶至关重要。轨迹预测是具有挑战性的,因为它需要推理代理人的过去运动,不同数量和代理人之间的社会交互,场景环境的约束以及人类行为的随机性。我们的方法在一种新颖的多智能体张量融合(MATF)网络中共同模拟这些相互作用和约束。具体而言,模型将多个代理的过去轨迹和场景上下文编码为多代理张量,然后应用卷积融合来捕获多重交互,同时保留代理的空间结构和场景上下文。该模型反复解码为多个特工的未来轨迹,利用对抗性损失来学习随机预测。在高速公路驾驶和行人人群数据集上的实验表明,该模型实现了最先进的预测精度。
translated by 谷歌翻译
高分辨率表示学习在许多视觉问题中起着重要作用,例如姿势估计和语义分割。最近开发用于人工估计的高分辨率网络(HRNet)〜\ _引用{SunXLW19}通过在\ emph {parallel}中连接高到低分辨率的卷积来维持整个过程的高分辨率表示,并产生强大的高分辨率表示通过反复进行平行卷积的融合。在本文中,我们通过引入简单而有效的修改对高分辨率表示进行了进一步的研究,并将其应用于广泛的视觉任务。我们通过聚合来自所有并行卷积的(上采样的)表示来增强高分辨率表示,而不是仅仅是高分辨率卷积中的表示,如在{SunXLW19}中所做的那样。这种简单的修改可以产生更强的表现形式,并且可以通过卓越的结我们展示了在城市景观,LIP和PASCAL背景下的语义分割以及AFLW,COFW,$ 300 $ W和WFLW的面部地标检测的最佳结果。此外,我们从高分辨率表示构建多级表示,并将其应用于更快的R-CNN对象检测框架和扩展框架。所提出的方法在现有的COCO对象检测单模型网络上取得了优异的成果。代码和模型已在\ url {https://github.com/HRNet}上公开。
translated by 谷歌翻译
口语理解(SLU)系统可以在两种类型的标记数据上进行训练:对齐或不对齐。未对齐的数据不需要逐字注释,更容易获得。在本文中,我们关注来自未对齐数据的口语语言理解,其中注释是一组完整的槽值三元组。以前的工作通常侧重于改进槽值对预测并分别估计对话行为类型,这忽略了act-slot-value三元组的层次结构。在这里,我们提出了一种新颖的分层解码模型,该模型以结构化方式动态地分析行为,时隙和值,并使用指针网络来处理词典外(OOV)值。对DSTC2数据集(一个基准未对齐数据集)的实验表明,所提出的模型不仅优于以前的最先进模型,而且可以有效且高效地推广到看不见的行为槽类型对和OOV值。
translated by 谷歌翻译
近年来,图像和视频编码技术已经跨越式发展。但是,由于图像和视频采集设备的普及,图像和视频数据的增长速度远远超出了压缩比的提高。特别地,已经广泛认识到在传统的混合编码框架内追求进一步的编码性能改进存在越来越多的挑战。深度卷积神经网络(CNN)使神经网络在近几年复苏,并在人工智能和信号处理领域取得了巨大成功,也为图像和视频压缩提供了一种新颖有前途的解决方案。在本文中,我们提供了基于神经网络的图像和视频压缩技术的系统,全面和最新的评论。分别介绍了基于神经网络的压缩方法在图像和视频中的演变和发展。更具体地说,提出并讨论了利用深度学习和HEVC框架的尖端视频编码技术,提升了最先进的视频编码性能。基本上。此外,还对基于神经网络的端到端图像和视频编码框架进行了分析,揭示了对下一代图像和视频编码框架/标准的有趣探索。突出了使用神经网络对图像和视频编码相关主题进行的最重要的研究工作,并且还设想了未来的趋势。特别是,初步探索了对语义和视觉信息的联合压缩,以制定人类视觉和机器视觉的高效信号表示结构,这是人工智能时代的两个主要信号接受者。
translated by 谷歌翻译