最近推出的Tsetlin Machine(TM)在几个基准测试中提供了具有竞争力的模式分类准确性,在命题逻辑中构成了具有易于解释的连接条款的模式。在本文中,我们通过引入一种新型的TMs,即回归Tsetlin机器(RTM)来超越模式分类。简而言之,我们修改TM的内部推理机制,以便将输入模式转换为单连续输出,而不是转换为不同的类别。我们通过以下方式实现这一目标:(1)使用TM的连接条款来捕获任意复杂的模式; (2)通过新颖的投票和规范化机制将这些模式映射到连续输出; (3)采用反馈方案更新TM条款,以尽量减少回归误差。反馈方案使用新的激活概率函数来稳定更新,同时整个系统收敛到准确的输入 - 输出映射。使用具有和不具有噪声的六个不同的人工数据集来评估所提出的方法的性能。将RTM的性能与Classical Tsetlin Machine(CTM)和MulticlassTsetlin Machine(MTM)进行比较。我们的实证结果表明,RTM获得了噪声和无噪声数据集的最佳训练和测试结果,条款数量较少。反过来,这使用更少的计算资源转化为更高的回归准确度。
translated by 谷歌翻译
最近提出了光学衍射神经网络(DNN)的概念,其通过级联相位掩模架构来实现。与光学计算机一样,该系统可以以全光学方式执行机器学习任务,例如数字数字识别。然而,该系统只能在非相干光照下工作,实际实验中的精度要求相当高。本文提出了一种基于单像素成像(MLSPI)的光学机器学习框架。 MLSPI系统可以执行与DNN相同的线性模式识别任务。此外,它可以在不相干的照明条件下工作,具有较低的实验复杂性和可编程的可编程性。
translated by 谷歌翻译
医疗应用通过要求高精度和易于解释来挑战当今的文本分类技术。尽管深度学习在准确性方面提供了一个飞跃,但这种飞跃是在牺牲可解释性的基础上实现的。为了解决这种准确性 - 可解释性挑战,我们首次引入了一种文本分类方法,该方法利用了最近引入的Tsetlin机器。简而言之,我们将文本的术语表示为命题变量。从这些,我们使用简单的命题公式捕获类别,例如:如果“rash”和“反应”和“青霉素”然后过敏。 Tsetlin机器从标签文本中学习这些公式,利用连接子句来表示每个类别的特定方面。实际上,即使没有术语(否定的特征)也可用于分类目的。我们与Na \'ive Bayes,决策树,线性支持向量机(SVM),随机森林,长期记忆(LSTM)神经网络和其他技术的实证比较是非常有用的.Tsetlin机器的表现与在20个新闻组和IMDb数据集上,以及非公共临床数据集上的所有评估方法都优于其他。平均而言,Tsetlin机器在数据集中提供最佳的召回率和精度分数。最后,我们的Tsetlin机器的GPU实现执行5比CPU实现快15倍,具体取决于数据集。因此我们相信,我们的novelapproach可以对广泛的文本分析应用产生重大影响,形成了使用Tsetlin机器进行更深层次自然语言理解的有希望的起点。
translated by 谷歌翻译
无人监督的域自适应重新识别采用标记的源数据来促进目标域的模型训练,面对由大域移位和大型摄像机变化引起的困境。非重叠标签质疑源域和目标域具有完全不同的人,进一步增加了重新识别难度。在本文中,我们提出了一种新的算法来缩小这种域差距。我们推导出一个摄像机样式适应框架,用于学习从目标域到源域的不同摄像机视图之间基于样式的映射,然后我们可以在摄像机级别上从源域到目标域进行基于身份的分发。为了克服非重叠标签挑战并引导人员重新识别模型进一步缩小差距,提出了一种有效的,有效的软标记方法,通过建立GAN翻译源域与之间的连接,挖掘目标域的内在局域结构。目标域。在真实基准数据集上进行的实验结果表明我们的方法获得了最先进的结果。
translated by 谷歌翻译
在自动驾驶车辆上逐渐出现了多个激光雷达,用于扩展视野和密集测量。然而,缺乏精确校准会对其局部化和感知系统中的潜在应用产生负面影响。在本文中,我们提出了一种新颖的系统,它能够实现自动多LiDAR校准,无需任何校准目标,先前的环境信息和外部参数的初始值。我们的方法首先是通过对齐每个传感器的估计运动进行自动初始化的手眼校准。然后通过最小化从点 - 平面对应构造的acost函数,使用基于外观的方法来细化所得到的参数。模拟和真实数据集的实验结果证明了我们的校准方法的可靠性和准确性。对于移动平台,所提出的方法可以校准多个LiDAR系统,其旋转和平移误差分别小于0.04 [rad]和0.1 [m]。
translated by 谷歌翻译
在本文中,我们使用一个时间演化图,它包含一系列的图快照,可以模拟许多真实世界的网络。我们在时间演化图中研究路径分类问题,该图在现实世界场景中具有许多应用,例如,预测电信网络中的路径故障并预测在不久的将来交通网络中的路径拥塞。为了捕捉时间依赖性和图形结构动力学,我们设计了一种名为Long Short-TermMemory R-GCN(LRGCN)的新型深度神经网络。 LRGCN将时间相邻图快照之间的时间依赖性视为与内存的特殊关系,并使用关系GCN来共同处理时间内和时间间关系。我们还提出了一种名为\ underline {s} elf- \ underline {a} ttentive \ underline {p} ath \ underline {e} mbedding(SAPE)的新路径表示方法,用于将任意长度的路径嵌入到固定长度的向量中。通过对加利福尼亚实际电信网络和交通网络的实验,我们证明了LRGCN在路径故障预测中对其他竞争方法的优越性,并证明了SAPE在路径表示上的有效性。
translated by 谷歌翻译
用于视频字幕的典型技术遵循编码器 - 解码器框架,其仅关注于正在处理的一个源视频。这种设计的潜在缺点是它不能捕获出现在多个相关视频内的数据的多个视觉上下文信息。为了解决这个限制,我们提出了用于视频字幕的存储器 - 目标逆流网络(MARN),其中设计存储器结构以探索单词及其在训练数据中的视频之间的各种类似视觉上下文之间的全谱对应。因此,我们的模型能够对每个单词实现更全面的理解,并产生更高的字幕质量。此外,构建的内存结构使我们的方法能够明确地模拟相邻单词之间的兼容性,而不是像大多数现有模型那样隐式学习模型。对两个真实数据集的广泛验证表明,我们的MARN始终优于最先进的方法。
translated by 谷歌翻译
近年来,深度学习在高光谱图像(HSI)分类方面取得了很大进展。特别是长短期记忆(LSTM)作为一种特殊的深度学习结构,在视频时间维度或HSI谱维数的长期依赖性建模方面表现出了很强的能力。但是,空间信息的丢失使其变得相当困难。获得更好的表现。为了解决这个问题,提出了两种新的深度模型,通过首次利用卷积LSTM(ConvLSTM)来提取更具辨别力的空间光谱特征。通过将局部滑动窗口中的数据片作为每个存储器单元带的输入,LSTM的2-D扩展体系结构被考虑用于构建空间光谱ConvLSTM 2-D神经网络(SSCL2DNN)来模拟远程依赖性。谱域。为了更有效地利用空间和光谱信息来提取更具判别性的空间光谱特征表示,通过将LSTM扩展到3-D版本,进一步提出了空间光谱ConvLSTM 3-DNeural网络(SSCL3DNN)。使用HSI数据集,证明所提出的深度模型具有一定的竞争优势,并且可以提供比其他最先进的方法更好的分类性能。
translated by 谷歌翻译
我们提出了一种新颖的高频残差学习框架,它为移动和嵌入式视觉问题提供了一种高效的多尺度网络(MSNet)架构。该架构利用两个网络:低分辨率网络有效地近似低频分量和高分辨率网络,通过重用上采样的低分辨率特征来学习高频残差。通过分类器校准模块,MSNetcan可在推理期间动态分配计算资源,以实现更快的速度和准确性权衡。我们在challengeImageNet-1k数据集上评估我们的方法,并观察不同基础网络的一致改进。在具有alpha = 1.0的ResNet-18和MobileNet上,MSNet在两种架构上都能获得1.5%的准确率,而不会增加计算量。在alpha = 0.25的更高效的MobileNet上,我们的方法在相同的计算量下获得3.8%的准确率。
translated by 谷歌翻译
在线广告中实时拍卖的出现已经引起了对市场竞争建模的巨大关注,即投标景观预测。该问题被制定为预测每个广告拍卖的市场价格的概率分布。考虑到第二价拍卖机制导致的审查问题,许多研究人员通过整合医学研究领域的生存分析,将投入用于投标景观预测。然而,大多数现有解决方案主要关注分段样本集群的基于计数的统计,或者基于分布形式的一些启发式假设来学习参数化模型。而且,他们既不考虑价格空间上的特征的连续模式。为了在细粒度的数据水平上捕捉更复杂但更灵活的模式,我们提出了一种深度景观预测(DLF)模型,该模型结合了概率分布预测的深度学习和审查处理的生存分析。具体而言,我们利用递归神经网络灵活地模拟条件获胜概率wrt每个出价。然后我们通过具有严格数学衍生的概率链规则进行bidlandscape预测。并且,以端到端的方式,我们通过最大限度地减少两个负面可能性损失来优化模型。如果没有针对投标景观分布形式的特定假设,我们的模型比以前的工作更适合于拟合各种复杂的市场价格分布。在两个大型真实世界数据集的实验中,我们的模型在各种指标下显着优于最先进的解决方案。
translated by 谷歌翻译