基于事件的摄像机是一种生物启发的视觉传感器,可在每个像素中异步记录强度变化(称为事件)。作为基于事件的相机的实例,动态和有源像素视觉传感器(DAVIS)结合了标准相机和基于事件的相机。但是,传统模型无法异步处理事件流。为了同步地分析事件,大多数现有方法在一定时间间隔内累积事件并将累积事件视为同步帧,这会浪费强度变化信息并削弱DAVIS的优势。因此,在本文中,我们提出了第一个神经异步方法基于事件的摄像头的toprocess事件流。我们的方法通过利用灰度帧的先前运动和关键特征来异步地从事件中提取动态信息。据我们所知,这是第一个通过新型深度神经网络分析事件流的神经异步方法。大量实验表明,我们提出的模型对最先进的基线实现了显着的改进。
translated by 谷歌翻译
极端多标签分类是指受监督的多标签学习,涉及数十万甚至数百万个标签。在本文中,我们开发了一种基于树的浅层算法,称为Bonsai,它可以促进标签空间的多样化,并可轻松扩展到数百万个标签。 Bonsai放宽了最近提出的基于树的算法Parabel的两个主要限制,Parabel将每个树节点上的标签分成两个子节点,并在这些节点之间实现标签平衡。相反,Bonsai通过以下方式鼓励分区过程中的大学:(i)允许更大的扇出节点,以及(ii)通过允许可能不平衡的分区来进一步保持标签集的多样性。通过允许这样的灵活性,它实现了两全其美 - 基于树的方法的快速训练和比Parabel更好的预测准确性,并且与一对一休息方法相当。因此,盆景优于最先进的技术。在预测精度方面,像DiSMEC这样的单对比休息方法,而紧急训练则是数量级。 \ bonsai的代码可以通过以下网址获得://github.com/xmc-aalto/bonsai。
translated by 谷歌翻译
在这项工作中,我们报告了结合IEEE国际生物医学成像研讨会(ISBI)2016和国际医学影像计算机辅助干预会议(MICCAI)2017年组织的肝肿瘤分割基准(LITS)的设置和结果。将24种有效的最先进的肝脏和肝脏肿瘤分段算法应用于一组131个计算机断层扫描(CT)体积,具有不同类型的肿瘤对比度水平(高强度/低强度),组织异常(转移瘤)大小和不同程度的病变。已提交的算法已在70个未公开的卷上进行了测试。该数据集是与七家医院和研究机构合作创建的,由三位独立的放射科医师手动审查。我们发现没有一种算法对肝脏和肿瘤表现最佳。最佳肝脏分割算法的Dice评分为0.96(MICCAI),而对于肿瘤分割,最佳算法评估为0.67(ISBI)和0.70(MICCAI)。 LITS图像数据和手动注释继续通过在线评估系统公开提供,作为持续的基准测试资源。
translated by 谷歌翻译
在本文中,我们概述了中国人工智能和法律挑战(CAIL2018)中的法律判断预测(LJP)竞争。本次大赛的重点是LJP,旨在根据实际情况预测判断结果。具体来说,在CAIL2018中,我们为参赛者提出了三个LJP子任务,即根据事实描述预测相关法律文章,指控和囚犯。 CAIL2018吸引了数百名参与者(来自269个组织的601个团队,1,144名参赛者)。在本文中,我们提供了CAIL2018中任务定义,相关工作,优秀方法和竞争结果的详细概述。
translated by 谷歌翻译
随机优化安全处理大规模敏感数据具有挑战性。最近,杜奇等人。提出了私有抽样策略来解决随机优化中的隐私泄漏问题。然而,这种策略导致稳健性退化,因为该策略等于每个梯度上的噪声注入,这对原始变量的更新产生不利影响。为了应对这一挑战,我们在本地隐私框架下引入了强大的随机优化,称为隐私保护StochasTIc渐进式学习(PRESTIGE)。 PRESTIGE桥梁通过渐进式课程学习(CL)私有化原始变量(通过私人抽样)的更新。具体来说,噪声注入会导致标签噪声问题,但CL的强大学习过程可以与标签噪声作斗争。因此,PRESTIGE在私人课程中产生primal变量的“私有但强大”的更新,即由CL提供的重新排序的标签序列。理论上,我们揭示了PRESTIGE的收敛速度和最大复杂度。六个数据集的实证结果表明,PRESTIGE在隐私保护和基线稳健性之间实现了良好的交互。
translated by 谷歌翻译
阅读理解设置有三种形式:问题,答案和背景。问答或问题生成的任务目的是在给出基于上下文的对应物时推断答案或问题。我们提出了一种新的双向神经序列转换模型,它连接三种模态,允许它同时学习两个任务并相互利益。在训练期间,模型接收问题 - 上下文 - 答案三元组作为输入,并通过分层注意过程捕获跨模态交互。与之前利用问题生成和数据级问题回答的二元性的联合学习范式不同,我们通过镜像网络结构和部分共享不同层的组件来解决架构级别的这种双重任务。这使得知识能够从一个任务转移到另一个任务,帮助模型找到每个模态的一般表示。对四个公共数据集的评估表明,我们的双学习模型执行单学习对应以及状态 - 关于问答和问题生成任务的艺术联合模型。
translated by 谷歌翻译
目前,开始研究将神经架构用于推荐系统的趋势。虽然提出了几种深度推荐模型,但大多数方法过于简单,无法表征用户的复杂偏好。在本文中,对于细粒度分析,用户的评级从多个角度进行解释,基于此,我们提出了我们的神经架构。具体来说,我们的模型采用几个连续阶段来编码用户和项目隐藏的表示。在一个阶段中,用户和项目从多个角度表示,并且在每个透视图中,用户和项目的表示彼此关注。最后,我们衡量最后阶段的输出表示以接近用户的评级。大量实验表明,我们的方法实现了对基线的实质性改进。
translated by 谷歌翻译
在本文中,我们介绍了\ textbf {C} hinese \ textbf {AI}和\ textbf {L} awchallenge数据集(CAIL2018),这是第一个用于判断预测的大型中文法律数据集。 \ datat包含由中国最高人民法院出版的超过2.6百万美元的刑事案件,这些案件比现有判决预测工作中的其他数据集大几倍。而且,判断结果的注释更加详细和丰富。它包括适用的法律条款,指控和监禁条款,预计将根据案件的事实描述推断。为了比较,我们为判断预测和实验结果实施了几个常规文本分类基准,表明对于当前模型来说,预测法律案件的判断结果仍然是一个挑战,尤其是对于案件的判断结果。为了帮助研究人员改进法律判断预测,数据集和基线都将在CAILcompetition \ footnote {http://cail.cipsc.org.cn/}之后发布。
translated by 谷歌翻译
点击率预测是工业应用中的重要任务,例如在线广告。最近提出了基于深度学习的模型,其遵循类似的嵌入\和MLP范例。在这些方法中,大规模稀疏输入特征首先被映射到低维度嵌入向量,然后以群组方式转换为固定长度向量,最后连接在一起以馈入多层感知器(MLP)以学习特征之间的非线性关系。通过这种方式,无论候选广告是什么,用户特征都被压缩成固定长度的表示向量。固定长度向量的使用将成为瓶颈,这使嵌入\和MLP方法难以从丰富的历史行为中有效地捕获用户的不同利益。在本文中,我们提出了一个新的模型:深度兴趣网络(DIN),它通过设计一个本地激活单元来自适应地从历史行为中了解用户兴趣的某些广告来应对这一挑战。该表示向量随着不同的广告而变化,极大地提高了模型的表达能力。此外,我们开发了两种技术:小批量感知正则化和数据自适应激活功能,可以帮助培训具有数亿个参数的工业深度网络。两个公共数据集的实验以及超过20亿个样本的阿里巴巴实际生产数据集证明了其有效性。提出的方法,与最先进的方法相比,可以实现卓越的性能。 DIN现已成功部署在阿里巴巴的在线显示广告系统中,为主要流量提供服务。
translated by 谷歌翻译
将一大块文本分割成单词通常是处理中文文本的第一步,但其必要性很少被探索过。在本文中,我们提出了中国分词(CWS)是否是基于深度学习的中国自然语言处理所必需的基本问题。基于神经词汇的Webenchmark模型依赖于基于神经char的模型的分词,这些模型不涉及四端到端NLP基准测试任务中的分词:语言建模,机器翻译,句子匹配/释义和文本分类。通过这两种模型之间的直接比较,我们发现基于char的模型始终优于基于单词的模型。基于这些观察,我们进行了全面的实验,以研究为什么基于单词的模型在这些基于深度学习的NLP任务中表现不佳。我们表明,因为基于单词的模型更容易受到数据稀疏性和词汇表外(OOV)词的影响,因此更容易过度拟合。我们希望本文能够鼓励社区研究人员重新思考基于深度学习的中国自然语言处理中分词的必要性。 \脚注{Yuxian Meng和Xiaoya Li对本报的贡献相同。}
translated by 谷歌翻译