人类在结构化和构图中感知这个看似混乱的世界,其前提是能够将概念实体与复杂的视觉场景隔离开来。将场景的基本视觉元素分组为概念实体的机制被称为感知分组。在这项工作中,我们提出了一种新型的空间混合模型,其具有可学习的先验,用于感知分组。与现有方法不同,所提出的方法将对象的表示形式化为“形状”和“外观”,它们由混合权重和条件概率分布分别建模。更具体地,视觉场景中的每个对象由一个混合分量建模,其混合权重和条件概率分布的参数分别由两个神经网络生成。混合权重集中于建模空间依赖性(即,形状),并且条件概率分布处理对象内变化(即,外观)。此外,背景被单独建模为与前景对象互补的特殊组件。对两个感知分组数据集的过度实证测试表明,所提出的方法在mostexperimental配置下优于最先进的方法。学习的概念实体可以推广到新颖的视觉场景,并且对物体的多样性不敏感。
translated by 谷歌翻译
在新兴的纳米物联网(IoNT)中,信息将通过复杂和扩散的媒体以分子的形式嵌入和传播。一个主要的挑战在于信道响应的长尾性质导致符号间干扰(ISI),这会降低检测性能。如果信道未知,我们不能轻易实现传统的相干信道估计和消除,并且ISI的影响将是在本文中,我们开发了一种用于分子信号盲检测的新型高维非相干方案。我们通过组合利用信号的瞬态特征的不同非相干度量,在更高维度的空间中实现这一点。通过推导任何构造的高维非相干度量的理论误码率(BER),我们证明了更高的维数总是在相同的样本空间中实现更低的BER。然后,我们设计了一个利用了Thearzen的广义盲检测算法。近似及其概率神经网络(Parzen-PNN)检测信息比特。利用其快速收敛和并行实现的优点,我们提出的方案可以满足检测精度和实时计算的需要。数值模拟表明,与其他最先进的方法相比,我们提出的方案可以获得10dB的BER。
translated by 谷歌翻译
跨项目缺陷预测(CPDP)旨在通过使用来自其他项目的历史缺陷数据训练的预测模型来预测项目训练数据的缺陷。但是,由于不同项目之间的分布差异,构建高质量的CPDP模型仍然是一个挑战。不幸的是,软件缺陷数据集的类不平衡性质进一步增加了难度。在本文中,我们通过考虑类平衡和特征重要性问题,提出了一种基于面向转移学习的少数过采样技术(TOMO)的基于特征加权转移的朴素贝叶斯(FWTNB)方法(TOMOFWTNB)用于CPDP。与传统的过采样技术不同,TOMO不仅可以平衡数据,还可以减少分布差异。然后FWTNB用于进一步增加两个分布的相似性。实验在11个公共缺陷数据集上进行。实验结果表明:(1)TOMO将平均G-Measure提高了23.7 \%$ \ sim $ 41.8%,平均MCC提高了54.2%,$ \ sim为77.8%。 (2)特征加权(FW)策略将平均G-Measure提高11%,平均MCC提高29.2%。 (3)TOMOFWTNB将平均G-Measure值提高了至少27.8%,平均MCC值提高了至少71.5%,与现有的CPDP方法相比。可以得出结论:(1)TOMO在解决CPDP情景中的类不平衡问题方面非常有效; (2)我们的FW策略有助于CPDP; (3)TOMOFWTNB优于以前最先进的CPDP方法。
translated by 谷歌翻译
在本文中,我们提出了一种新方法来解决地震勘探领域中从时间序列数据到空间图像的映射挑战,即通过深度神经网络(DNN)直接从地震数据重建速度模型。解决这种不适定的地震反演问题的传统方法是通过迭代算法,其具有poornonlinear映射和强非唯一性。其他尝试可能导致人为干预错误或未充分利用地震数据。 DNNs面临的挑战主要在于弱空间对应,地震数据与速度模型之间不确定的反射 - 接收关系以及地震数据的时变性质。为了应对这些挑战,我们提出了一个端到端的地震反演网络(SeisInvNet forshort),它具有新颖的组件,可以最好地利用所有地震数据。具体来说,我们从每个地震道开始,并通过其邻居信息,观测设置对其进行增强。和相应的地震剖面的全球背景。然后,通过增强的地震道,可以学习空间对齐的特征图,并进一步连接到重建速度模型。总的来说,我们通过寻找空间对应性,让每个地震轨迹都有助于构建整个速度模型。所提出的SeisInvNet一致地在基线上产生改进,并根据各种评估指标在我们提出的SeisInv数据集上实现了有希望的性能,并且反演结果更加一致从速度值,地下结构和地质界面等方面得出目标。除了优越的性能外,还仔细讨论了该机制,并确定了一些潜在的问题以供进一步研究。
translated by 谷歌翻译
尽管深层神经网络(DNN)与人类大脑之间存在显着的相似性,如先前的研究所示,DNN在许多视觉任务中仍然落后于人类,这表明两个系统之间存在相当大的差异。为了探究它们的不同之处,我们利用对偶噪声(AN)和对抗性干扰(AI)图像,在原型DNN(AlexNet)和人类视觉中产生明显的识别性能。通过两个系统中的常规(RE)和对抗性图像的诱发活动进行了彻底的比较。我们发现人脑中RE和对抗性图像之间的代表性相似性类似于它们的感知相似性。然而,这种表示 - 感知关联在DNN中被破坏。特别是,RE和AN图像之间的代表性相似性从低层到高层同时增加。此外,正向编码建模揭示了先前研究中提出的DNN-大脑分层对应仅在两个系统处理RE和AI图像而非AN图像时才成立。这些结果可能是由于当前DNN的确定性建模方法。总之,我们的研究结果为DNN与人类大脑之间的比较提供了一个互补的视角,并强调了表征其差异的必要性,以进一步弥合人工和人类智能研究。
translated by 谷歌翻译
游戏AI的下一个挑战在于实时战略(RTS)游戏。 RTSgames提供部分可观察的游戏环境,其中代理在比GO大得多的动作空间中彼此交互。掌握RTSgames需要强大的宏观策略和微妙的微观层次执行。最近,微观层面的执行已取得很大进展,而宏观战略的完整解决方案仍然缺乏。在本文中,我们提出了基于学习的分层宏观策略模型,用于掌握MOBAgames,一种RTS游戏的子类型。通过分层宏策略模型训练,代理明确地做出宏策略决策并进一步指导他们的微观级别执行。此外,每个代理人都做出独立的战略决策,同时通过平衡一种新颖的模仿跨代理通信机制与盟友进行沟通。我们对流行的5v5多人在线对战竞技场(MOBA)游戏进行综合评估。我们的5-AI团队在人类玩家队伍中获胜率达到48%,在玩家排名系统中排名前1%。
translated by 谷歌翻译
正交频分复用(OFDM)是当前通信系统中广泛应用的关键技术之一。近年来,人工智能(AI)辅助OFDM接收机已成为打破传统OFDM系统瓶颈的最前沿。在本文中,我们分别研究了两个AI辅助OFDM接收器,数据驱动的全连接深度神经网络(FC-DNN)接收器和模型驱动的ComNet接收器。我们首先通过仿真研究它们在不同信道模型下的性能,然后使用5G快速原型(RaPro)系统进行空中(OTA)测试,建立实时视频传输系统。为了解决由于在线训练的信道模型与真实环境之间的差异而导致的模拟和OTA测试之间的性能差距,我们开发了一种新的在线训练策略,称为SwitchNet接收器。 SwitchNet接收器具有灵活且可扩展的架构,可通过在线培训一个参数来适应实际频道。 OTA测试验证了其对环境的可行性和稳健性,并指出了其未来通信系统的潜力。在本文的最后,我们讨论了激发未来研究的一些挑战。
translated by 谷歌翻译
在以人为中心的智能建筑中,人体舒适度的实时测量起着关键作用,并为建筑采暖,通风和空调(HVAC)系统提供反馈控制信号。由于个体内和个体间差异以及皮肤细微变化的挑战,目前尚无令人满意的热舒适度测量解决方案。本文提出了一种基于皮肤敏感指数和深度学习(NISDL)的无创测量方法来测量实时温度。一个新的评估指标,即皮肤敏感指数(SSI),被定义为克服个体差异和皮肤细微变化。为了说明SSI提出的有效性,设计了两个多层深度学习框架(NISDL方法I和II)和DenseNet201用于从皮肤图像中提取特征。部分个人饱和度温度(NIPST)算法用于算法比较。还为算法比较生成了另一种没有SSI(DL)的加深学习算法。最后,总共144万个图像数据用于算法验证。结果表明,55.6180%和52.2472%的误差值(NISDL方法I,II)分散在[0,0.25],NIPST的相同误差区间分布为35.3933%。
translated by 谷歌翻译
异常检测是智能视频监控中的一个具有挑战性的问题。现有的大多数方法都是计算消耗,不能满足实时要求。在本文中,我们提出了一种具有低计算复杂度和高效率的实时异常检测框架。提出了一种名为“幅度光流直方图”(HMOF)的新功能,用于捕获视频补丁的运动。与现有的特征描述符相比,HMOF对运动幅度更敏感,并且更有效地区分异常信息。 HMOF特征是针对前景补丁计算的,并且由自动编码器重构以便更好地聚类。然后,我们使用GaussianMixture Model(GMM)分类器来区分视频中的异常和正常活动。实验结果表明,我们的框架优于最先进的方法,可以实时可靠地检测异常。
translated by 谷歌翻译
我们提出了一种基于像素亲和度信息的实例分割方案,它是属于同一实例的两个像素的关系。在我们的方案中,我们使用具有相似结构的两个神经网络。 Oneis用于预测像素级语义分数,另一种用于推导像素级亲和度。关于像素作为顶点和亲缘关系作为边缘,我们提出了简单而有效的图合并算法,将像素聚类成实例。实验结果表明,我们的方案可以生成细粒度的实例掩码。通过Cityscapes训练数据,该方案在测试集上实现了27.3 AP。
translated by 谷歌翻译