社交媒体帖子包含有关医疗条件和与健康相关行为的潜在有价值的信息。生物重建VII任务3专注于通过识别推文中的药物和膳食补充剂的提及来挖掘这些信息。我们通过精细调整多个BERT样式语言模型来执行此任务以执行令牌级分类,并将它们组合成集合以生成最终预测。我们最好的系统由五个Megatron-Bert-345M型号组成,在看不见的测试数据上实现了0.764的严格F1得分。
translated by 谷歌翻译
生物重建VII Track-2挑战包括命名实体识别,实体链接(或实体 - 归一化),主题索引任务 - 与实体和主题限制为这项挑战的化学品。命名实体识别是一个完善的问题,我们通过基于Bert的生物群体模型实现了我们的最佳性能。我们将基于BERT的方法扩展到实体链接任务。在预先预订Biobert的第二阶段,通过称为自对准预先训练(SAP)的度量学习损失策略,我们将基于其SAP-Biobert Word Embeddings之间的余弦相似性链接实体。尽管我们的命名实体识别实验取得了成功,但我们发现化学指数任务一般更具挑战性。除了传统的NER方法之外,我们还尝试使用基于新颖的文本或“提示”方法的命名实体识别和实体链接,该方法使用生成语言模型,例如T5和GPT。我们通过这种新方法实现了令人鼓舞的结果。
translated by 谷歌翻译
在Bircocrive VII的Track-1中,要求参与者识别药物/化学品和蛋白质之间的相互作用。提供每个药物/化学和蛋白质的内部名称实体注释,必须自动预测14个不同的相互作用中的一种。对于此关系提取任务,我们尝试两种基于BERT的句子分类方法,以及使用T5模型的更新文本到文本方法。我们发现基于BERT的模型一般表现更好,我们的生物综太基模型实现了所有指标的最高分,实现了0.74 F1得分。虽然我们的小说T5文本到文本方法没有表现出基于BERT的大多数模型,但它表现出在类似数据上培训的那些,呈现出有希望的结果,实现0.65 F1得分。我们认为,与关系提取的文本文本方法有一些竞争优势,并且有很多研究进步的空间。
translated by 谷歌翻译
最近,从热图像的深度和自我运动的自我监督学习在具有挑战性的情景下,热量图像的深度和自我运动的学习表现出强大的鲁棒性和可靠性。然而,诸如弱对比度,模糊边缘和噪声阻碍的固有的热图像属性,以产生从热图像产生有效的自我监督。因此,大多数研究依赖于额外的自我监督源,例如LOT-LIT RGB图像,生成模型和LIDAR信息。在本文中,我们对热图像特性进行了深入的分析,从而从热图像退化自我监督。基于分析,我们提出了一种有效的热图像映射方法,其显着增加了图像信息,例如整体结构,对比度和细节,同时保持时间一致性。所提出的方法显示出比以前的最先进的网络的表现优于优势和姿势,而不利用额外的RGB引导。
translated by 谷歌翻译
域适应(DA)最近在医学影像社区提出了强烈的兴趣。虽然已经提出了大量DA技术进行了用于图像分割,但大多数这些技术已经在私有数据集或小公共可用数据集上验证。此外,这些数据集主要解决了单级问题。为了解决这些限制,与第24届医学图像计算和计算机辅助干预(Miccai 2021)结合第24届国际会议组织交叉模态域适应(Crossmoda)挑战。 Crossmoda是无监督跨型号DA的第一个大型和多级基准。挑战的目标是分割参与前庭施瓦新瘤(VS)的后续和治疗规划的两个关键脑结构:VS和Cochleas。目前,使用对比度增强的T1(CET1)MRI进行VS患者的诊断和监测。然而,使用诸如高分辨率T2(HRT2)MRI的非对比度序列越来越感兴趣。因此,我们创建了一个无人监督的跨模型分段基准。训练集提供注释CET1(n = 105)和未配对的非注释的HRT2(n = 105)。目的是在测试集中提供的HRT2上自动对HRT2进行单侧VS和双侧耳蜗分割(n = 137)。共有16支球队提交了评估阶段的算法。顶级履行团队达成的表现水平非常高(最佳中位数骰子 - vs:88.4%; Cochleas:85.7%)并接近完全监督(中位数骰子 - vs:92.5%;耳蜗:87.7%)。所有顶级执行方法都使用图像到图像转换方法将源域图像转换为伪目标域图像。然后使用这些生成的图像和为源图像提供的手动注释进行培训分割网络。
translated by 谷歌翻译
联合学习(FL)在分布式客户端上培训机器学习模型,而不会暴露单个数据。与通常基于仔细组织的数据的集中培训不同,FL处理通常不混阻和不平衡的设备数据。因此,处理所有数据的传统流行训练协议同样地导致浪费本地计算资源,并减慢全局学习过程。为此,我们提出了一个系统性的FLBalancer,它积极选择客户的培训样本。我们的示例选择策略在尊重客户端的隐私和计算能力的同时优先确定更多“信息性”数据。为了更好地利用样本选择来加速全球培训,我们进一步推出了一种自适应截止日期控制方案,该方案预测每个轮的最佳截止日期,具有不同的客户端列车数据。与具有截止日期配置方法的现有流算法相比,我们对三个不同域的五个数据集的评估表明,FedBalancer将时间至准确性的性能提高1.22〜4.62倍,同时提高模型精度1.0〜3.3%。我们还表明,通过展示在与三种不同的FL算法共同运行时,FedBalancer提高了收敛速度和准确性,可以随时适用于其他流动方法。
translated by 谷歌翻译
生成的对抗网络(GaN)中的发电机以粗到精细的方式学习图像生成,其中早期层学习图像的整体结构和后者细化细节。要播放粗略信息,最近的作品通常通过堆叠多个残差块来构建其发电机。虽然残余块可以产生高质量的图像以及稳定地训练,但它经常阻碍网络中的信息流。为了减轻这个问题,本简要介绍了一种新的发电机架构,通过组合通过两个不同的分支获得的特征来产生图像:主和辅助分支。主分支的目标是通过通过多个剩余块来产生图像,而辅助分支是将早期层中的粗略信息传送到稍后的块。要成功结合主和辅助分支机构中的功能,我们还提出了一个门控功能融合模块,用于控制这些分支机构中的信息流。为了证明所提出的方法的优越性,本简要提供了使用Cifar-10,CiFar-100,Lsun,Celeba-HQ,AFHQ和Tiny-ImageNet的各种标准数据集提供了广泛的实验。此外,我们进行了各种消融研究,以证明所提出的方法的泛化能力。定量评估证明,该方法在成立得分(IS)和FRECHET成立距离(FID)方面表现出令人印象深刻的GAN性能。例如,该方法可以分别提高FID,并分别在35.13至25.00和20.23至25.57之间的微小图像数据集上的分数。
translated by 谷歌翻译
在学习第二语言(L2)时,往往吞噬其无效和低效的学生的最重要但乏味的组件之一是词汇习得,或者更简单地放置,记住言语。鉴于此类,追踪学习者的词汇知识状态的个性化和教育词汇推荐系统将具有巨大的学习影响,因为它可以解决这两个问题。因此,在本文中,我们提出并释放了一个名为教学词推荐(PWR)的新型任务的数据。 PWR的主要目标是预测给定的学习者是否知道一个基于学习者已经看到的其他单词的给定的单词。为了详细说明,我们通过智能辅导系统(其)收集此数据,该系统可为〜1M L2学习者进行维修,他们研究标准化的英语考试,托耶特。作为这一点的特征,学生可以直接表明他们不知道他们解决的问题不知道,以创建字母。最后,我们报告了神经协作过滤方法的评估结果以及探索性数据分析,并讨论了该数据集作为对此任务的未来研究的基准的影响和功效。
translated by 谷歌翻译
自动驾驶汽车和自主驾驶研究一直受到现代人工智能应用中主要有希望的前景。根据先进的驾驶员辅助系统(ADAS)的演变,自动驾驶车辆和自主驱动系统的设计变得复杂和安全至关重要。通常,智能系统同时和有效地激活ADAS功能。因此,必须考虑可靠的ADAS功能协调,安全地控制驱动系统。为了处理这个问题,本文提出了一种随机的对抗性模仿学习(RAIL)算法。铁路是一种新的无衍生仿制学习方法,用于具有各种ADAS功能协调的自主驾驶;因此,它模仿决策者的运作,可以使用各种ADAS功能控制自动驾驶。该方法能够培训涉及激光雷达数据的决策者,并控制多车道复合道环境中的自主驾驶。基于仿真的评估验证了所提出的方法实现了所需的性能。
translated by 谷歌翻译
基于快速的神经形态的视觉传感器(动态视觉传感器,DVS)可以与基于较慢的帧的传感器组合,以实现比使用例如固定运动近似的传统方法更高质量的帧间内插。光流。在这项工作中,我们展示了一个新的高级事件模拟器,可以产生由相机钻机录制的现实场景,该仪器具有位于固定偏移的任意数量的传感器。它包括具有现实图像质量降低效果的新型可配置帧的图像传感器模型,以及具有更精确的特性的扩展DVS模型。我们使用我们的模拟器培训一个新的重建模型,专为高FPS视频的端到端重建而设计。与以前发表的方法不同,我们的方法不需要帧和DVS相机具有相同的光学,位置或相机分辨率。它还不限于物体与传感器的固定距离。我们表明我们的模拟器生成的数据可用于训练我们的新模型,导致在与最先进的公共数据集上的公共数据集中的重建图像。我们还向传感器展示了真实传感器记录的数据。
translated by 谷歌翻译