我们讨论\ emph {跨语言文本量化}(CLTQ),执行文本量化的任务(即估计所有类的相对频率$ p_ {c}(D)$ $ c \ in \ mathcal {C} $ in当训练文档可用于源语言$ \ mathcal {S} $但不能用于需要执行量化的目标语言$ \ mathcal {T} $时,一组$ D $ of unlabelleddocuments)。 CLTQ从未在文献中讨论过;我们通过将最先进的量化方法与能够生成所涉及的源文档和目标文档的跨语言矢量表示的方法相结合来建立二元案例的基线结果。我们提出了在公开可用的数据集中获得的跨语言情感分类的实验结果;结果表明,所提出的方法可以以惊人的准确度执行CLTQ。
translated by 谷歌翻译
多语言文本分类(PLC)包括根据一组共同的C类自动分类文档,每个文档用一组语言L中的一种编写,并且比通过其相应的语言特定分类器对每个文档进行天真分类时更准确地进行分类。为了提高给定语言的分类准确度,系统也需要利用其他语言编写的训练样例。我们通过漏斗处理multilabel PLC,这是我们在此提出的一种新的集成学习方法。漏斗包括生成一个两层分类系统,其中所有文档,无论语言如何,都由同一(第二层)分类器分类。对于该分类器,所有文档都表示在一个共同的,与语言无关的特征空间中,该特征空间由第一层语言相关分类器生成的后验概率组成。这允许对任何语言的所有测试文档进行分类,以受益于所有语言的所有培训文档中存在的信息。我们提供了大量的实验,在公开的多语言文本集上运行,其中显示漏斗显着优于许多最先进的基线。所有代码和数据集(invector表单)都是公开的。
translated by 谷歌翻译
本文介绍了PyDCI,一种用Python编写的DistributionalCorrespondence Indexing(DCI)的新实现。 DCI是跨域和跨语言文本分类的转移学习方法,我们已经提供了一个基于JaTeCS(一种用于文本分类的Javaframework)构建的实现(此处称为JaDCI)。 PyDCI是DCI thatexploits scikit-learn和SciPy堆栈的独立版本。我们在这里报告我们为了测试PyDCI而进行的新实验,其中我们使用asbaselines在DCI被原始提出之后出现的新的高性能方法。这些实验表明,由于我们改进了DCI的一些微妙方法,PyDCI优于JaDCI和上述高性能方法,并且在我们测试DCI的两个流行基准测试中提供了最着名的结果,即MultiDomainSentiment (又名MDS - 用于跨域适应)和Webis-CLS-10(用于跨语言适应)。 PyDCI以及代码复制我们的实验,可以通过以下网址获得:http://github.com/AlexMoreo/pydci。
translated by 谷歌翻译
量化是一种监督学习任务,其包括在给定一组C类和未标记项目的集合D的情况下预测C中每个类别c的普遍性(或相关频率)p(c | D)。量化可以通过以下原则来解决:对所有未标记的项目进行分类并计算其中的多少项目归因于每个类别。然而,这种“分类和计数”方法已被证明可以产生次优的量化准确度;这已经将量化确定为其自身的任务,并且产生了为其专门设计的多种方法。我们提出了一种用于量化的循环神经网络架构(我们称之为QuaNet),它遵循分类预测来学习更高阶的“量化嵌入”,然后通过结合简单分类和计数方法的量化预测来改进。我们测试{QuaNet关于情感量化的文本,表明它基本上优于几个最先进的基线。
translated by 谷歌翻译
神经网络捕获关系知识的能力是一个长期存在争议的问题。最近,PDP的一些研究人员认为,(1)经典PDP模型可以处理关系结构(Rogers&McClelland,2008,2014)和(2)深度学习方法对文本处理的成功表明结构化表示是不必要的。捕捉人类语言的要点(Rabovsky等,2018)。在目前的研究中,我们测试了Story Gestalt模型(St. John,1992),一个经典的文本理解PDP模型,以及一个带有注意力模型的序列到序列(Bahdanau等,2015),一个当代深度学习架构的文本处理。两个模型都经过培训,可以根据几个概念在故事中扮演的主题角色回答有关故事的问题。在三个关键测试中,我们改变了新故事的统计结构,同时保持他们的关系结构在训练数据方面保持不变。每个模型都容易受到每个统计结构操纵到不同程度的影响,他们的表现低于机会,至少不能操纵。我们认为两种模型的失败都是由于它们无法对独立角色和填充物进行动态绑定这一事实。最后,这些结果使传统神经网络模型适用于解释基于关系推理的现象,包括语言处理。
translated by 谷歌翻译
ArCo是意大利文化遗产知识图,由七个词汇网络和1.69亿个三倍体组成,约有82万个文化实体。它与SPARQL端点,用于将目录记录转换为RDF的软件以及丰富的文档材料(测试,评估,操作方法,示例等)共同分发。 ArCo基于意大利文化遗产和活动部(MiBAC)的官方总目录 - 及其相关的编码规则 - 收集和验证(理想情况下)CH管理员提供的所有意大利文化遗产特性(不包括图书馆和档案馆)的目录记录。遍布意大利。我们介绍其结构,设计方法和工具,其增长社区,并描述其重要性,质量和影响。
translated by 谷歌翻译
作为实例级识别问题,人员重新识别(ReID)依赖于判别特征,其不仅捕获不同的空间尺度而且还封装多个尺度的任意组合。 Wecall同构和异构尺度的全尺度特征的这些特征。在本文中,设计了一种新的深度CNN,称为Omni-ScaleNetwork(OSNet),用于ReID中的全方位特征学习。这是通过设计由多个卷积特征流组成的残差块来实现的,每个卷积特征流检测特定尺度的特征。重要的是,引入了一种新颖的统一聚集门,以动态融合多尺度特征的输入相关的信道方向权重。为了有效地学习空间 - 通道相关并避免过度拟合,构建块使用逐点和深度卷积。通过逐层堆叠这些块,我们的OSNet非常轻巧,可以在现有的ReIDbenchmarks上从头开始进行培训。尽管模型尺寸较小,但我们的OSNet在六人ReID数据集上实现了最先进的性能。
translated by 谷歌翻译
真实世界的自动驾驶车辆通常在先验的非知识环境中运行。由于这些系统中的大多数都是安全关键的,因此确保它们在面对环境不确定性(例如看不见的障碍物)时安全运行非常重要。当前的安全分析工具使得自治系统能够在给出有关环境状态的完整信息的情况下对安全性进行审查。但是,这些工具无法很好地适应实时感测环境的情况,例如在导航任务期间。在这项工作中,我们提出了一种基于哈密尔顿 - 雅可比可达性的新型实时安全分析方法,该方法在环境不确定的情况下提供了强有力的安全保证。我们的安全方法与计划者无关,并为各种测绘传感器提供保证。我们展示了我们的方法模拟和硬件,以围绕最先进的基于视觉的,基于学习的规划器提供安全保障。
translated by 谷歌翻译
人工智能(AI)应用程序被用于预测和评估多个领域的行为,例如刑事司法和消费者财务,这直接影响人类福祉。但是,如果AI是为了改善人们的生活,那么人们必须能够信任AI,这意味着能够理解系统正在做什么以及为什么。尽管在这种情况下透明度通常被视为要求,但实际上它可能并不总是可行的或可取的,而确保系统在设定的道德范围内运行的需要仍然存在。在本文中,我们提出了一种方法,在监测其输入和输出的基础上,评估人工智能系统的道德界限。我们通过将道德价值映射到限制输入和输出的明确可验证规范,在系统周围放置一个“玻璃盒子”,这样如果这些仍然在框内,我们可以保证系统坚持价值。对输入和输出的关注允许对完全不同的智能系统进行验证和比较;来自深度神经网络的基于代理的系统。将抽象道德价值观明确转化为具体规范,在可解释性方面带来了巨大的好处;利益相关者确切地知道该制度如何解释和运用相关的抽象道德人类价值并相应地校准他们的信任。此外,通过在更高级别操作,我们可以检查系统是否符合相同值的不同解释。这些优势将对人工智能系统用户的福祉产生影响,建立他们的信任并为他们提供有关系统如何遵守道德价值观的具体知识。
translated by 谷歌翻译
用于无监督表示学习的最先进方法可以训练标准卷积神经网络的前几层,但是它们不如针对更深层的监督学习那么好。这可能是由于浅层的一般性和相对简单的性质;然而,这些方法被应用于数百万张图像,由于未标记的数据收集起来很便宜,因此可扩展性被宣传为主要优势。在本文中,我们质疑这种做法,并询问是否真的需要这么多图像才能容忍无监督学习效果最好的图层。我们的主要结果是,一些甚至单个图像以及强大的数据增强功能足以使性能几乎达到饱和。具体来说,我们提供了三种不同的自我监督特征学习方法(BiGAN,RotNet,DeepCluster)与训练图像数量(1,10,1000)的分析,并表明我们只使用公共网络的前两个卷积层的准确性。单个未标记的训练图像,并获得其他层的竞争结果。我们进一步研究和可视化学习表示作为哪个(单个)图像用于训练的功能。我们的结果也可以通过浅层不同网络捕获哪种类型的信息。
translated by 谷歌翻译