生物重建VII轨道3挑战重点是在Twitter用户时间表中识别药物名称。对于我们提交这一挑战,我们通过使用多种数据增强技术扩展了可用的培训数据。然后,增强数据用于微调在一般域推特内容上预先培训的语言模型的集合。拟议的方法优于先前的最先进的算法Kusuri,并在竞争中排名高,为我们所选择的客观函数重叠F1分数。
translated by 谷歌翻译
我们通过在轮子上的光加权外骨骼提出了一个用于低体积受损的用户的个人移动装置。在其核心上,一种新型的被动外骨骼提供姿势过渡,利用自然身体姿势,该姿势在静坐的静止和静坐(STS)过渡时,通过单个气体弹簧作为储能单元,通过支撑架上的躯干。我们通过双轮线系统提出膝盖和髋关节的方向依赖性耦合,从躯干运动转移到膝关节致动器处的力矩负载来平衡躯干运动。在这里,外骨骼最大化能量转移和用户运动的自然。我们介绍了一个体现的用户界面,用于通过躯干压力感测通过躯干压力感测,导致平均$ 19 ^ {\ rIC} \ PM 13 ^ {\ rIC} $上六个未受害的用户。我们评估了11月11日未受害的用户在过渡期间观察动作和肌肉活动的STS帮助的设计。结果比较辅助和无归档的STS转型验证了涉及的肌肉群体的显着减少(高达68美元\%$ 5,01.01 $)。此外,我们通过自然躯干倾斜运动来显示它是可行的$ + 12 ^ {\ riC} \ pm 6.5 ^ {\ circ} $和$ - 13.7 ^ {\ rIC} \ pm 6.1 ^ {\ riC} $ staity和分别坐着。被动灾害迁移援助保证进一步努力提高其适用性和扩大用户人口。
translated by 谷歌翻译
通常,基于生物谱系的控制系统可能不依赖于各个预期行为或合作适当运行。相反,这种系统应该了解未经授权的访问尝试的恶意程序。文献中提供的一些作品建议通过步态识别方法来解决问题。这些方法旨在通过内在的可察觉功能来识别人类,尽管穿着衣服或配件。虽然该问题表示相对长时间的挑战,但是为处理问题的大多数技术存在与特征提取和低分类率相关的几个缺点,以及其他问题。然而,最近的深度学习方法是一种强大的一组工具,可以处理几乎任何图像和计算机视觉相关问题,为步态识别提供最重要的结果。因此,这项工作提供了通过步态认可的关于生物识别检测的最近作品的调查汇编,重点是深入学习方法,强调他们的益处,暴露出弱点。此外,它还呈现用于解决相关约束的数据集,方法和体系结构的分类和表征描述。
translated by 谷歌翻译
开放式识别通过将测试样本分类为来自训练或“未知”的已知类之一来概括分类任务。作为一种新的癌症药物鸡尾酒,不断发现改善治疗,预测癌症治疗可以在开放式识别问题方面自然地配制。由于在训练期间建模未知样品,因此从医疗开放式学习中的先前工作的直接实现产生了缺点。因此,我们重新确定问题方法,并应用最近的现有高斯混合变分性AutoEncoder模型,其实现了图像数据集的最新结果,乳腺癌患者数据。与最近的方法相比,我们不仅获得了更准确和稳健的分类结果,平均F1增加了24.5%,但我们还在部署到临床环境方面重新审视开放式识别。
translated by 谷歌翻译
口语识别(SLR)是指用于确定语音样本中存在的语言的自动进程。例如,SLR是一个重要的任务,例如,作为分析或分类大量多语言数据的工具。此外,它也是用于在工作流中选择下游应用的必要工具,例如,选择适当的语音识别或机器转换模型。 SLR系统通常由两个阶段组成,其中提取表示音频样本的嵌入的一个阶段,并且第二个是计算每种语言的最终分数的次数。在这项工作中,我们将SLR任务接近作为检测问题,并实现第二阶段作为概率线性判别分析(PLDA)模型。我们表明,对PLDA参数的鉴别性培训相对于通常的生成培训提供了大的收益。此外,我们提出了一种新的分层方法是训练了两个PLDA模型,一个是生成高度相关语言的集群的分数,以及第二个是为每个群集产生分数的分数。最终的语言检测分数被计算为这两种分数的组合。完整的模型判别训练,以优化跨熵目标。我们表明,该层次方法始终如一地优于非等级化,以检测高度相关的语言,在许多情况下大幅度的边缘。我们培训我们的系统在包含100种语言的数据集合中,并在匹配和不匹配的条件下测试它们,表明增益是强大的状态不匹配。
translated by 谷歌翻译
由于深度学习的进步和数据集的增加,自动许可证板识别(ALPR)系统对来自多个区域的牌照(LPS)的表现显着。对深度ALPR系统的评估通常在每个数据集内完成;因此,如果这种结果是泛化能力的可靠指标,则是可疑的。在本文中,我们提出了一种传统分配的与休假 - 单数据集实验设置,以统一地评估12个光学字符识别(OCR)模型的交叉数据集泛化,其在九个公共数据集上应用于LP识别,具有良好的品种在若干方面(例如,获取设置,图像分辨率和LP布局)。我们还介绍了一个用于端到端ALPR的公共数据集,这是第一个包含带有Mercosur LP的车辆的图像和摩托车图像数量最多的图像。实验结果揭示了传统分离协议的局限性,用于评估ALPR上下文中的方法,因为在训练和测试休假时,大多数数据集在大多数数据集中的性能显着下降。
translated by 谷歌翻译
根据研究人员在歧视和校准性能方面采用的标准评估实践,这项工作旨在了解阶级不平衡对胸部X射线分类器的性能的影响。首先,我们进行了一项文献研究,分析了普通科学实践并确认:(1)即使在处理高度不平衡的数据集时,社区也倾向于使用由大多数阶级主导的指标; (2)包括包括胸部X射线分类器的校准研究仍然罕见,尽管其在医疗保健的背景下的重要性。其次,我们对两个主要胸部X射线数据集进行了系统实验,探讨了不同类别比率下的几种性能指标的行为,并显示了广泛采用的指标可以隐藏少数阶级中的性能。最后,我们提出了通过两个替代度量,精密召回曲线和平衡的Brier得分,这更好地反映了系统在这种情况下的性能。我们的研究结果表明,胸部X射线分类器研究界采用的当前评估实践可能无法反映真实临床情景中计算机辅助诊断系统的性能,并建议改善这种情况的替代方案。
translated by 谷歌翻译
虚假图像的更高质量和广泛传播已经为可靠的法医制作产生了追求。最近已经提出了许多GaN图像探测器。然而,在现实世界的情景中,他们中的大多数都表现出有限的鲁棒性和泛化能力。此外,它们通常依赖于测试时间不可用的侧面信息,即它们不是普遍的。我们研究了这些问题,并基于有限的子采样架构和合适的对比学习范例提出了一种新的GaN图像检测器。在具有挑战性的条件下进行的实验证明了提出的方法是迈向通用GaN图像检测的第一步,确保对常见的图像障碍以及看不见的架构的良好概括。
translated by 谷歌翻译
ising机器是一个有前途的非von-neumann用于神经网络训练和组合优化的计算概念。然而,虽然可以用诸如展示机器实现各种神经网络,但是它们无法执行快速统计采样使得它们与数字计算机相比训练这些神经网络的效率低。在这里,我们通过注入模拟噪声来介绍一个通用概念,以实现具有ising机器的超快统计抽样。通过光电型机,我们证明这可用于精确采样Boltzmann分布和无监督的神经网络训练,具有与基于软件的培训等于准确性。通过模拟,我们发现ising机器可以比基于软件的方法更快地执行统计采样顺序。这使得Ising Machines成为机器学习的有效工具和超出组合优化的其他应用。
translated by 谷歌翻译
基于知识的视觉问题应答(kbvqa)是一个需要外部世界知识的双模形任务,以便正确回答文本问题和相关图像。最近的单个模态文本工作已经显示了知识注入预培训的语言模型,特别是实体增强知识图形嵌入式,可以提高下游实体的任务的性能。在这项工作中,我们经验研究了在双模模型设置中应用的方法以及是否可以提高KBVQA任务的现有VQA系统的性能。我们试验两个大型公共可用的VQA数据集,(1)KVQA,其中包含大多数罕见的维基百科实体和(2)OKVQA,其与常识推理具有较少的实体和更符合。两者都缺乏明确的实体跨度,我们研究了不同弱监督和手动方法获得的效果。此外,我们分析了最近提出的双模和单一模态注意力的解释,这些实体增强了增强的表示。我们的结果表明,在KBVQA任务上表现出实质性的性能,无需额外的昂贵的预培训,我们为实体知识注射有助于提高模型的理解时提供见解。我们提供代码和增强的数据集以进行再现性。
translated by 谷歌翻译