我们提出了BERTScore,一种用于文本生成的自动评估指标。对于常见指标,\ method计算候选句中每个标记与参考中每个标记的相似性得分。然而,我们使用上下文化的BERTembeddings来计算相似度,而不是查看完全匹配。我们对几种机器翻译和图像字幕标记进行了评估,并表明BERTScore与人类判断相关的指标更好地相关,通常甚至明显优于任务特定的监督指标。
translated by 谷歌翻译
In this technical report, we introduce FastFusionNet, an efficient variant of FusionNet [12]. FusionNet is a high performing reading comprehension architecture, which was designed primarily for maximum retrieval accuracy with less regard towards computational requirements. For FastFusionNets we remove the expensive CoVe layers [21] and substitute the BiLSTMs with far more efficient SRU layers [19]. The resulting architecture obtains state-of-the-art results on DAWNBench [5] while achieving the lowest training and inference time on SQuAD [25] to-date. The code is available at https://github.com/felixgwu/FastFusionNet.
translated by 谷歌翻译
由于人工智能(AI)的成熟,分类问题取得了重大进展。然而,区分物品与没有明显界限的类别对于机器来说仍然是一个巨大的挑战 - 这对于机器智能化也至关重要。为了研究模糊概念的分类,我们用四阶段的操作流程来定义和提出全局性检测。然后,我们使用他们的地理位置在Facebook公共页面类似图表上展示我们的框架。我们的预测算法实现了高精度(89%)和召回(88%)的本地页面。我们评估州和国家级别的结果,发现在那些拥有大型和国际城市的州(纽约州,加利福尼亚州),全球节点比率相对较高。本文还展示并研究了几个全局节点的例子。我们希望我们的结果从每个分类问题中揭示出完美的价值,并提供对在线社交网络(OSN)中全局和本地节点的更好理解。
translated by 谷歌翻译
图形卷积网络(GCN)已广泛用于半监督设置中的图节点分类。以前的工作表明,GCN容易受到现有节点的邻接和特征矩阵的扰动。但是,更改许多应用程序中的现有节点是不现实的,例如社交网络中的现有用户。在本文中,我们设计了通过添加假节点来攻击GCN的算法。提出了一种贪婪算法来生成伪节点的邻接和特征矩阵,旨在最大化现有节点上的分类精度。另外,我们引入一个鉴别器来对来自真实节点的假节点进行分类,并提出一个Greedy-GAN攻击来同时更新鉴别器和攻击者,使虚假节点与真实节点无法区分。我们的非目标攻击将GCN的准确度降低到0.10,并且我们的目标攻击在整个数据集上达到99%的成功率,并且攻击单个目标节点的平均攻击率达到94%。
translated by 谷歌翻译
稀疏矢量的线性编码广泛流行,但最常见的是数据独立 - 缺少任何可能的额外(但先验未知)结构超出稀疏性。在本文中,我们提出了一种新的方法来学习适应数据的线性编码器,同时仍然使用广泛使用的$ \ ell_1 $解码器。凸的$ \ ell_1 $解码器根据需要进行标准自动编码器训练,防止梯度传播。我们的方法是基于将凸解码器展开到$ T $投影梯度步骤的洞察力可以解决这个问题。我们的方法可以看作是学习压缩传感矩阵的数据驱动方式。我们的实验表明,在几个真实数据集中确实存在超出稀疏性的额外结构。我们的自动编码器能够发现并利用它来创建出色的重建,与先前的技术方法相比,测量更少。
translated by 谷歌翻译
评估生成性对抗网络(GAN)具有内在的挑战性。在本文中,我们重新审视了几个基于样本的代表性GAN评估度量,并解决了如何评估评估度量的问题。我们从指标的一些必要条件开始,以产生有意义的分数,例如区分真实样本和生成样本,识别模式丢弃和模式折叠,以及检测过度拟合。 Witha系列精心设计的实验,我们全面调查现有的基于样本的指标,并在实际环境中确定其优势和局限性。基于这些结果,我们观察到内核最大平均差异(MMD)和1-最近邻(1-NN)双样本测试似乎满足大多数理想的属性,前提是样本之间的距离是在合适的特征空间中计算的。我们的实验还揭示了几个流行的GAN模型的行为的有趣属性,例如它们是否记忆训练样本,以及它们在多大程度上不会影响目标分布。
translated by 谷歌翻译
机器学习社区越来越关注预测模型中的偏差和歧视的潜力。这促使人们越来越多地研究分类程序“公平”的意义。在本文中,我们研究了在保持校准概率估计值的同时最小化不同群体群体之间的误差之间的紧张关系。我们证明校准仅与单个误差约束兼容(即,跨组的假阴性率相等),并且表明满足这种放宽的任何算法并不比随机化现有分类器的预测百分比更好。这些扩展和推广现有结果的调查结果在几个数据集上得到了实证。
translated by 谷歌翻译
我们通过$ \ ell_1 $ -minimization研究从一组信号中全局恢复字典的问题。我们假设信号是asi.i.d生成的。来自完整参考字典$ D ^ * \ in \ mathbb R ^ {K \ times K} $的$ K $原子的随机线性组合,其中线性组合系数来自伯努利型模型或精确稀疏模型。首先,我们获得必要且充分的规范条件,引用的字典$ D ^ * $是预期的$ \ ell_1 $目标函数的一个尖锐的局部最小值。我们的结果大大扩展了Wu和Yu(2015)的结果,并允许组合系数是非负的。其次,我们在所引用的字典的目标值最小的区域上获得显式绑定。第三,我们证明了参考字典是唯一的尖锐局部最小值,从而建立了第一个已知的$ \ ell_1 $ -minimization字典学习的全局属性。在理论结果的推动下,我们引入了基于扰动的测试来确定adictionary是否是目标函数的尖锐局部最小值。此外,我们还提出了一种新的基于Block CoordinateDescent的字典学习算法,称为DL-BCD,保证具有单调收敛性。模拟研究表明DL-BCD在恢复率方面具有竞争性,与许多状态相比。 -art字典学习算法。
translated by 谷歌翻译
车辆重新识别是一个重要的问题,随着视频监控和智能传输应用的快速扩展而变得可取。通过回顾人类视觉的识别过程,我们发现当人类识别不同的车辆时存在本地的等级依赖性。具体地,人类总是首先确定一个车辆的粗粒度类别,即汽车模型/类型。然后,在预测的汽车模型/类型的分支下,他们将通过细微的视觉线索(例如,定制的绘画和挡风玻璃)在细粒度水平上识别特定的车辆。受粗到细分层过程的启发,我们提出了一种用于车辆重新识别的端到端基于RNN的分层注意(RNN-HA)分类模型。 RNN-HA由三个相互耦合的模块组成:第一个模块生成车辆图像的图像表示,第二个层次模块模拟上述层级依赖关系,最后一个注意模块侧重于捕获特定车辆彼此之间的细微视觉信息识别。通过对两个车辆重新识别基准数据集VeRi和VehicleID进行全面的实验,我们证明了所提出的模型实现了超越现有技术的卓越性能。
translated by 谷歌翻译
仅从原始样本到相应的二进制标签学习一个投影矩阵太严格,并且因此会丢失一些数据的固有几何结构。在本文中,我们提出了一种新的基于过渡子空间学习的最小二乘回归(TSL-LSR)模型形式分类图像分类。 TSL-LSR的主要思想是学习原始样本和二进制标签之间的过渡子空间,以缓解严格投影学习引起的过度拟合问题。此外,为了反映转移矩阵的基础低秩结构并且学习更多判别性投影矩阵,在转移子空间中增加了低秩约束。几个图像数据集的实验结果证明了所提出的TSL-LSR模型与最先进的算法相比的有效性
translated by 谷歌翻译