量化是一种监督学习任务,其包括在给定一组C类和未标记项目的集合D的情况下预测C中每个类别c的普遍性(或相关频率)p(c | D)。量化可以通过以下原则来解决:对所有未标记的项目进行分类并计算其中的多少项目归因于每个类别。然而,这种“分类和计数”方法已被证明可以产生次优的量化准确度;这已经将量化确定为其自身的任务,并且产生了为其专门设计的多种方法。我们提出了一种用于量化的循环神经网络架构(我们称之为QuaNet),它遵循分类预测来学习更高阶的“量化嵌入”,然后通过结合简单分类和计数方法的量化预测来改进。我们测试{QuaNet关于情感量化的文本,表明它基本上优于几个最先进的基线。
translated by 谷歌翻译
多语言文本分类(PLC)包括根据一组共同的C类自动分类文档,每个文档用一组语言L中的一种编写,并且比通过其相应的语言特定分类器对每个文档进行天真分类时更准确地进行分类。为了提高给定语言的分类准确度,系统也需要利用其他语言编写的训练样例。我们通过漏斗处理multilabel PLC,这是我们在此提出的一种新的集成学习方法。漏斗包括生成一个两层分类系统,其中所有文档,无论语言如何,都由同一(第二层)分类器分类。对于该分类器,所有文档都表示在一个共同的,与语言无关的特征空间中,该特征空间由第一层语言相关分类器生成的后验概率组成。这允许对任何语言的所有测试文档进行分类,以受益于所有语言的所有培训文档中存在的信息。我们提供了大量的实验,在公开的多语言文本集上运行,其中显示漏斗显着优于许多最先进的基线。所有代码和数据集(invector表单)都是公开的。
translated by 谷歌翻译
本文介绍了PyDCI,一种用Python编写的DistributionalCorrespondence Indexing(DCI)的新实现。 DCI是跨域和跨语言文本分类的转移学习方法,我们已经提供了一个基于JaTeCS(一种用于文本分类的Javaframework)构建的实现(此处称为JaDCI)。 PyDCI是DCI thatexploits scikit-learn和SciPy堆栈的独立版本。我们在这里报告我们为了测试PyDCI而进行的新实验,其中我们使用asbaselines在DCI被原始提出之后出现的新的高性能方法。这些实验表明,由于我们改进了DCI的一些微妙方法,PyDCI优于JaDCI和上述高性能方法,并且在我们测试DCI的两个流行基准测试中提供了最着名的结果,即MultiDomainSentiment (又名MDS - 用于跨域适应)和Webis-CLS-10(用于跨语言适应)。 PyDCI以及代码复制我们的实验,可以通过以下网址获得:http://github.com/AlexMoreo/pydci。
translated by 谷歌翻译
传统上,信号分类是需要先前的信号知识的过程。人类专家决定从信号中提取哪些特征,并用作分类系统的输入。这种要求可以使专家错过信号的重要未知信息,而不包括在特征中。本文提出了一种新的方法,可以自动分析信号并提取特征而无需任何人参与。因此,不需要关于要分类的信号的先前知识。所提出的方法基于遗传编程,并且为了测试该方法,它已经应用于与癫痫有关的众所周知的EEG数据库,癫痫是数百万人遭受的疾病。如结果部分所示,获得了高分类精度
translated by 谷歌翻译
我们考虑为具有交互动态和稀疏可用通信的移动机器人的大型网络寻找分布式控制器的问题。我们的方法是通过在训练时使用全局信息模仿集中控制器的策略来学习本地控制器,这些控制器在测试时仅需要本地信息和本地通信。通过将聚合图神经网络扩展到时变信号和时变网络支持,我们学习了一个通用的本地控制器,它可以通过仅使用本地通信交换来从远程队友那里获取信息。我们将这种方法应用于分散线性二次调节器问题,并观察通信速率和较小网络程度如何增加多跳信息的价值。学习分散式植绒控制器的独立实验证明了随着机器人移动而改变的通信图表的性能。
translated by 谷歌翻译
我们设想一个简洁地描述空中交通管制规则的系统,协助人类操作员并支持商业机场密集的自主空中交通。我们开发了一种方法,通过最大熵逆增强学习,从真实数据中学习空中交通控制规则作为成本函数。此成本函数用作基于研究的运动规划方法的惩罚,该方法将控制和状态空间离散化。我们通过展示我们的方法可以模仿机场到达路线和密集商业空中交通的分离规则来说明这种方法。得到的轨迹显示是安全,可行和有效的。
translated by 谷歌翻译
十年前,比特币被引入,成为第一个加密货币,并将“区块链”概念作为分布式账本。截至今天,有许多不同的加密货币实现在ablockchain上,具有不同的方法和哲学。然而,许多共同的特征是:它们需要工作量证明来支持块(采矿)的生成,并最终支持货币的生成。这种工作证明方案通常包括解决加密问题,最常见的是打破哈希值,这只能通过蛮力来实现。工作量证明的主要缺点是需要大量的能量,这需要大得多的能量。除了支持货币之外没有任何有用的结果。在本文中,我们提出了一个理论提案,它引入了有用工作方案,以支持在ablockchain上运行的加密货币,我们将其命名为Coin.AI.在该系统中,挖掘方案需要深度学习模型,并且仅当这种模型的性能超过阈值时才开采块。分布式系统允许节点以简单的方式验证矿工提供的模型(当然比挖掘过程本身更有效),确定何时生成块。此外,本文提出了一个存储证明方案,用于为深度学习模型提供存储的用户,以及关于如何制定系统力学的理论论文,其最终目标是使人工智能获得民主化。
translated by 谷歌翻译
我们回顾了由傅立叶级数和积分驱动的神经网络架构,它们被称为傅里叶神经网络。这些网络在合成和现实世界的任务中进行了实证评估。在现实世界的任务中,它们都不如标准的神经网络具有S形激活功能。当涉及多个变量的已知函数的近似时,所有神经网络(傅立叶和标准神经网络)凭经验证明比截断的傅立叶级数更低的近似误差。
translated by 谷歌翻译
进入RobotriX,这是一个非常逼真的室内数据集,旨在使深度学习技术应用于各种机器人视觉问题。 RobotriX由机器人代理探索的超现实室内场景组成,机器人代理也在模拟世界中以视觉上的方式与对象进行交互。虚幻引擎将逼真的场景和机器人渲染到虚拟现实耳机中,捕捉凝视,人类操作员可以移动机器人并使用控制器进行机器人手术;场景信息以每帧为基础进行转储,以便可以离线生成以生成原始数据和地面真实标签。通过这种方法,我们能够生成38个语义类的数据集,总共8Mstills以每秒+60帧的速度记录,具有全高清分辨率。对于每个帧,RGB-D和3D信息在两个空间中都提供完整注释。由于原始信息和注释的高质量和数量,RobotriX将成为使用大规​​模数据驱动技术研究2D和3D机器人视觉任务的新里程碑。
translated by 谷歌翻译
组织病理学癌症诊断基于染色组织切片的视觉检查。苏木精和曙红(H \&E)是世界范围内常规使用的标准染色剂。它易于获取并且具有成本效益,但是细胞和组织成分显示出低对比度,具有深蓝色和粉红色的不同色调,这使得难以进行视觉评估,数字图像分析和定量。这些限制可以通过组织载玻片的靶蛋白的IHC染色来克服。 IHC提供细胞和组织成分的选择性高对比度成像,但它们的使用在很大程度上受到实验室处理的复杂性和高成本的限制。我们提出了非传统的CycleGAN(cCGAN)网络,将H \&E染色的图像转换为IHC染色的图像,促进同一载玻片上的虚拟IHC染色。该数据驱动方法仅需要有限量的标记数据,但将生成像素级分割结果。所提出的cCGAN模型通过添加类别条件和引入两个结构损失函数来改进原始网络\ zite {zhu_unpaired_2017},实现了多子语言翻译并提高了翻译准确性。 %需要在这里给出理由。实验表明,所提出的模型在具有多子域的非配对图像转换中优于原始方法。我们还探索了不成对图像的潜力,以及应用于其他组织学图像相关任务的图像转换方法,使用不同的染色技术。
translated by 谷歌翻译