缺乏医生处方指南是美国目前阿片类药物流行的一个关键驱动因素。在这项工作中,我们分析了药物药物索赔数据,以了解最初合成阿片类药物后更容易出现不良后果的患者特征。为此,我们提出了一种生成模型,该模型允许从亚组的观察数据中发现,这些数据显示由于治疗而增加或减少的因果效应。我们的方法将子群作为混合分布进行建模,使用稀疏性来增强解释性,同时联合学习潜在结果的非线性预测因子以更好地调整混淆。该方法导致对已发现的子群的人类可解释的见解,提高决策支持的实用性
translated by 谷歌翻译
本文介绍了一种新的开放式域名问答框架,其中猎犬和读者互相迭代地互动。框架与机器读取模型的体系结构无关,只需要访问读取器的令牌级隐藏表示。 Theretriever使用快速最近邻搜索来缩放到包含数百万个段落的语料库。门控循环单元在读取器状态的每个步进条件下更新查询,并且重新构造的查询用于通过检索器对段落进行排序。我们进行分析并显示有用的互动有助于从信息中检索信息性段落。最后,我们展示了我们的多步推理框架在应用于各种大型开放域数据集的两个广泛使用的读者架构Dr.DrQA和BiDAF时带来了一致的改进 - TriviaQA-unfiltered,QuasarT,SearchQA和SQuAD-Open。
translated by 谷歌翻译
我们介绍ARCHANGEL;一种新颖的分布式分类帐系统,用于确保数字视频档案的长期完整性。首先,我们描述了一种新的深度网络架构,用于计算持续时间为几分钟或几小时的视听流中的紧凑时间内容哈希(TCH)。我们的TCH对意外或恶意内容修改(篡改)敏感,但不适用于用于编码视频的编解码器。这是必要的,因为档案馆要求随着时间的推移格式化移动视频以确保无缝可访问性。其次,我们描述了TCH(以及用于驱动它们的模型)是如何通过分布在多个独立档案中的权威证明区块链来保护的。我们报告了ARCHANGEL在英国,爱沙尼亚和挪威的国家政府档案参与的试验部署背景下的功效。
translated by 谷歌翻译
成立I4U联盟是为了促进联合进入NISTspeaker识别评估(SRE)。这种关节提交的最新版本在SRE 2018中,其中I4U提交是最佳表现系统之一。 SRE'18也标志着I4Uconsortium进入NIST SRE系列评估10周年。本文的主要目的是总结基于提交给SRE'18的各子系统及其融合的结果和经验教训。我们也有意提出一个共同观点,即我们在过去十年中从SRE'08到SRE'18见证了SRE参与者的进步,进展和主要范式转变。在这方面,除其他外,我们已经看到从超向量表示到深度说话人嵌入的范例转换,以及从信道补偿到领域适应的研究挑战的转变。
translated by 谷歌翻译
最近,深度模型已成功应用于多种应用,尤其是低级表示。然而,稀疏,嘈杂的样本和结构域(具有多个对象和交互)是大多数深层模型中的一些开放挑战。 Column Networks,一种深层架构,可以捕获这样的域结构和交互,但仍然可以从稀疏和噪声样本中进行次优学习。受人工智能中人工建议指导学习的成功启发,特别是在数据遗留物中,我们提出了知识增强列网络,利用人类的设备/知识,通过噪声/稀疏样本更好地学习。我们的实验表明,我们的方法可以带来更好的整体性能或更快的收敛(即有效和高效)。
translated by 谷歌翻译
人体的整个运动经历了一个名为Gait Cycle的周期性过程。人脚的结构是成功完成周期的关键因素。这种足部结构的异常是先天性疾病的一种惊人形式,其导致基于人类足印图像的几何形状的分类。图像处理是确定一系列足迹参数以检测紊乱严重程度的最有效方法之一。本文旨在通过生物医学图像处理,使用一个名为Modified Brucken Index的足迹参数来检测扁平足和高拱足异常。
translated by 谷歌翻译
We propose a novel conditioned text generation model. It draws inspiration from traditional template-based text generation techniques , where the source provides the content (i.e., what to say), and the template influences how to say it. Building on the successful encoder-decoder paradigm, it first encodes the content representation from the given input text; to produce the output, it retrieves exemplar text from the training data as "soft templates," which are then used to construct an exemplar-specific decoder. We evaluate the proposed model on abstractive text sum-marization and data-to-text generation. Empirical results show that this model achieves strong performance and outperforms comparable baselines.
translated by 谷歌翻译
量化是减少用于边缘计算的神经网络的存储器占用的常用技术,其需要降低用于网络参数的浮点表示的精度。使用测试来估计这种舍入误差对神经网络的整体性能的影响,该测试不是详尽的,因此不能用于保证模型的安全性。我们提出了一个基于满意度模理论(SMT)求解器的框架,以量化神经网络对参数扰动的鲁棒性。为此,我们引入了局部和全局鲁棒性的概念,这些概念捕获了由于参数量化引起的类别分配置信度的偏差。然后,鲁棒性概念被转换为SMT问题的实例,并使用求解器自动求解,例如dReal。我们在两个简单的多层感知器(MLP)上演示了我们的框架,它在二维输入上执行二进制分类。除了对稳健性进行量化之外,我们还表明,对于我们的MLP,整流线性单元激活比线性激活具有更高的鲁棒性。
translated by 谷歌翻译
我们建议使用Lasso Weighted $ k $ -means($ LW $ - $ k $ -means)算法作为高维数据的简单但有效的稀疏聚类过程,其中特征($ p $)的数量可以比观察次数($ n $)。在$ LW $ - $ k $ -means算法中,我们直接在特征权重上引入一个基于套索的精确项,以在稀疏聚类的框架中结合特征选择。 $ LW $ - $ k $ -means不对给定数据集进行任何分布假设,因此,引入用于特征选择的非参数方法。我们还分析地研究了基础优化过程的收敛性,以$ LW $ - $ k $ -means来建立我们算法的强一致性。 $ LW $ - $ k $ -means在几个真实和合成数据集上进行测试,通过详细的实验分析,我们发现该方法的性能与一些最先进的聚类和特征选择程序相比具有很强的竞争力,而不是仅在聚类精度方面,而且在计算时间方面。
translated by 谷歌翻译
数据以前所未有的速度产生,超过了我们的分析能力。数据库社区开创的一个可行的解决方案是近似查询处理(AQP)。 AQP试图在计算确切答案所需的一小部分时间内提供查询的近似答案。这通常是通过对预先计算或按需派生的样本运行查询并基于结果生成整个数据集的估计来实现的。在这项工作中,我们探索了一种利用深度学习(DL)的AQP的新方法。我们使用深度生成模型,一种基于无监督学习的方法,以紧凑的方式(通常为几百KB)忠实地学习数据分布。可以通过从学习模型生成样本来近似回答查询。这种方法消除了AQP对固定大小样本的依赖性,并允许我们通过非常快速地生成所需的manysamples来满足任意精度要求。虽然我们专注于变换编码器(VAE),但我们展示了我们的方法如何也可用于其他流行的DL模型,如生成对抗网络(GAN)和deepBayesian网络(DBN)。我们的其他贡献包括(a)通过基于拒绝抽样的方法识别模型和最小化模型(b)为AQP建立模型集合以提高准确性的算法和(c)对VAE潜在空间的分析以了解其对AQP的适应性。 Ourextensive实验表明,深度学习是一种非常有前途的方法。
translated by 谷歌翻译