缺乏医生处方指南是美国目前阿片类药物流行的一个关键驱动因素。在这项工作中,我们分析了药物药物索赔数据,以了解最初合成阿片类药物后更容易出现不良后果的患者特征。为此,我们提出了一种生成模型,该模型允许从亚组的观察数据中发现,这些数据显示由于治疗而增加或减少的因果效应。我们的方法将子群作为混合分布进行建模,使用稀疏性来增强解释性,同时联合学习潜在结果的非线性预测因子以更好地调整混淆。该方法导致对已发现的子群的人类可解释的见解,提高决策支持的实用性
translated by 谷歌翻译
为了理解各种自然语言命令,今天的虚拟助手通过大量劳动密集型,手动注释的句子进行训练。本文介绍了一种方法和Genie工具包,它可以轻松地处理新的复合命令。我们提倡使用虚拟助手编程语言(VAPL)正式化虚拟助手的能力,并使用神经语义解析器将自然语言转换为VAPL代码。精灵只需要一小组现实的输入句子来验证神经模型。开发人员编写模板来合成数据; Genie使用众包释义和数据扩充以及合成数据来训练语义解析器。我们还提出了使VAPL语言适合自然语言翻译的设计原则。我们应用这些原则来修改ThingTalk,这是Almond virtualassistant使用的语言。我们使用Genie构建第一个语义解析器,它可以使用不带引号的自由格式参数来支持复合虚拟助手命令。 Genieachie在实际用户输入上的准确率为62%。我们通过显示比音乐技能,集合功能和访问控制的前一个状态提高了19%和31%来证明Genie的普遍性。
translated by 谷歌翻译
青光眼是世界范围内可预防,不可逆转的失明的主要原因。这种疾病可以保持无症状直至严重,估计有50%-90%的青光眼患者仍未确诊。因此,建议对青光眼筛查进行早期检测和治疗。检测青光眼的一种经济有效的工具可以扩大医疗保健对更大患者群体的访问,但目前还没有这种工具。我们使用5833幅图像的回顾性数据集训练深度学习(DL)算法,评估可升级性,青光眼视神经乳头(ONH)特征和可逆性青光眼风险。使用2个单独的数据集验证所得算法。对于可参考的青光眼风险,该算法在验证数据集“A”中具有0.940(95%CI,0.922-0.955)的AUC(1,205个图像,1个图像/患者; 19%可参考其中图像由研究员培训的青光眼专家小组裁定,并在验证数据集“B”中分析0.858(95%CI,0.836-0.878)(来自9,643名患者的17,593张图像; 9.2%的图像来自亚特兰大退伍军人事务部眼科诊所糖尿病视网膜电视检查程序使用临床转诊决定作为参考标准)。此外,我们发现垂直杯与椎间盘比> = 0.7,神经视网膜边缘,视网膜神经纤维层缺损和裸露的环形血管的存在对青光眼专家和算法的青光眼风险评估贡献最大。对于青光眼ONH特征,算法AUC介于0.608-0.977之间。 DL算法对10名年级学生中的6名(包括3名青光眼专家中的2名)具有明显更高的敏感性,相对于所有评分者具有相当或更高的特异性。仅在眼底图像上训练的DL算法可以以更高的灵敏度和对眼睛护理提供者的可比特异性来检测可参考的青光眼风险。
translated by 谷歌翻译
Oral drugs are becoming increasingly common in oncology care. In contrast to intravenous chemotherapy, which is administered in the clinic and carefully tracked via structured electronic health records (EHRs), oral drug treatment is self-administered and therefore not tracked as well. Often, the details of oral cancer treatment occur only in unstructured clinic notes. Extracting this information is critical to understanding a patient's treatment history. Yet, this is a challenging task because treatment intervals must be inferred longitudinally from both explicit mentions in the text as well as from document timestamps. In this work, we present TIFTI (Temporally Integrated Framework for Treatment Intervals), a robust framework for extracting oral drug treatment intervals from a patient's unstructured notes. TIFTI leverages distinct sources of temporal information by breaking the problem down into two separate subtasks: document-level sequence labeling and date extraction. On a labeled dataset of metastatic renal-cell carcinoma (RCC) patients, it exactly matched the labeled start date in 46% of the examples (86% of the examples within 30 days), and it exactly matched the labeled end date in 52% of the examples (78% of the examples within 30 days). Without retraining, the model achieved a similar level of performance on a labeled dataset of advanced non-small-cell lung cancer (NSCLC) patients.
translated by 谷歌翻译
自网络出现以来,wen的数据量已增加了数百万。近年来,生成的Web数据不仅仅是数据存储多年。一种重要的数据格式是文本。为了回答用户对互联网的疑问,并克服信息过载的问题,一个可能的解决方案是文本文档摘要。这不仅减少了查询访问时间,还根据特定用户需求优化了文档结果。文本文档的摘要可以分为抽象和提取。大多数工作都是在Extractivesummarization的方向上完成的。提取总结结果是原始文档的子集,其目标是更多内容覆盖和lea冗余。我们的工作基于采掘方法。在第一种方法中,我们使用一些统计特征和基于语义的特征。将情绪作为一种特征包含在一种观点中,这种观点是从情感起着重要作用的观点出发的。有效传达信息。因此,它可能在文本文档化中起着至关重要的作用。
translated by 谷歌翻译
本文总结了我们作为2018IEEE大数据杯国际会议一部分举办的道路损伤检测和分类挑战的解决方案的设计,实验和结果。道路损坏的自动检测和分类是维护和自动驾驶等多种应用的基本问题。我们证明了基于卷积神经网络的实例检测和分类方法可以用来解决这个问题。特别地,我们展示了Mask-RCNN,它是用于自然图像的对象检测,定位和实例分割的最先进算法之一,可用于以快速的方式执行该任务并获得有效结果。我们在使用智能手机相机获取的真实世界道路图像中检测和分类不同类型的损伤任务时,在IoU为50%时获得0.528的平均得分,并且我们在NVIDIA GeForce 1080Tigraphic上的每幅图像的平均参考时间为0.105秒卡。我们的方法的代码和保存模型可以在这里找到:https://github.com/sshkhr/BigDataCup18提交
translated by 谷歌翻译
音乐在很大程度上依赖于重复来构建结构和意义。自我引用发生在多个时间尺度上,从主题到短语再到整个音乐部分的重用,例如具有ABA结构的片段。变形金刚(Vaswani et al。,2017)是一种基于自我关注的序列模型,在需要保持长程一致性的许多代任务中取得了令人瞩目的成果。这表明自我关注也可能非常适合音乐建模。然而,在音乐创作和表演中,相对时间至关重要。用于基于成对距离表示变压器中的相对位置信息的现有方法(Shaw等,2018)。这对于诸如音乐作品的长序列是不切实际的,因为它们的存储器复杂性在序列长度上是二次的。我们提出了一种算法,可以将中间内存需求减少到序列长度的线性。这使得我们能够证明具有我们经过修改的相对注意力机制的变形金刚可以生成具有引人注目结构的长达数千步的组合,生成连续性地对agiven主题进行详细阐述的连续性,并且在seq2seq设置中生成以条件为条件的伴奏。我们在两个数据集,JSB Chorales和Piano-e-competition上用我们的相对注意机制评估Transformer,并获得后者的最新结果。
translated by 谷歌翻译
高效且简单的图像和体积分割具有很大的实用价值。促使我们的方法的分割问题源于材料科学和医学中常用的成像。我们将图像分割制定为概率像素分类问题,并且我们将分段应用为表征图像内容的一个步骤。我们的方法允许用户通过交互地标记像素子集来定义感兴趣的结构。由于实时反馈,用户可以根据当前结果进行策略性地放置新标记。最终像素分类可以从非常适度的用户输入获得。我们的方法的一个重要组成部分是对图像内容进行编码的图表。该图在初始化期间以不受监督的方式构建,并且基于图像特征的聚类。由于我们将有限数量的用户标记数据与从图像的未标记部分获得的聚类信息相结合,因此我们的方法适用于半监督学习的一般框架。我们通过像素分类来说明这是一种非常有效的分割方法。
translated by 谷歌翻译
这项工作将图像显着性预测的深度神经模型适应于以自我为中心的视频的时间域。我们计算每个视频帧的显着性图,首先使用从静态图像训练的现成模型,然后添加用视频显着性预测的数据集训练的卷积或卷积LSTM层。我们研究EgoMon上的每个配置,这是一个由三个主题自由观看和任务驱动的设置记录的七个以自我为中心的视频组成的新数据集。我们的结果表明,当观察者不移动并从狭窄的视野观察场景时,时间适应是有益的。受到这种观察的鼓舞,我们计算并发布了EPIC Kitchens数据集的资料图,其中观众正在烹饪。可用的源代码和模型://imatge-upc.github.io/saliency-2018-videosalgan/
translated by 谷歌翻译
脚本定义了有关如何展开日常场景(例如去餐馆)的知识。学习脚本的挑战之一是知识的层次性。例如,一名被捕的嫌疑人可能无辜或有罪,并且意外事件发生的情况也大不相同。为了捕获这种类型的信息,我们提出了一个具有由分类变量层次定义的潜在空间的自动编码器模型。我们利用最近提出的基于矢量量化的方法,该方法允许连续嵌入与每个潜在变量值相关联。这允许解码器通过参与给定设置的值嵌入来轻柔地决定要调节的最后层次的哪些部分。我们的模型有效地编码和生成脚本,在几个标准任务上优于基于语言建模的方法,并且允许自动编码器模型与先前基于语言建模的方法相比实现显着更低的困惑分数。
translated by 谷歌翻译