在本文中,我们开发FaceQVEC,一种软件组件,用于估计ISO / IEC 19794-5中所考虑的每个要点的面部图像的符合性,这是一个质量标准,该标准定义了将它们可接受或不可接受的面部图像的一般质量指南用于官方文件,如护照或身份证。这种质量评估的工具可以有助于提高面部识别的准确性,并确定哪些因素影响给定的面部图像的质量,并采取行动消除或减少这些因素,例如,具有后处理技术或重新获取图像。 FaceQVEC由与上述标准中预期的不同点相关的25个单独测试的自动化,以及被认为与面部质量有关的图像的其他特征。我们首先包括在现实条件下捕获的开发数据集上评估的质量测试的结果。我们使用这些结果来调整每个测试的判定阈值。然后,我们再次在评估数据库中再次检查,该评估数据库包含在开发期间未见的新脸部图像。评估结果展示了个人测试的准确性,用于检查遵守ISO / IEC 19794-5。 Faceqvec可在线获取(https://github.com/uam-biometrics/faceqvec)。
translated by 谷歌翻译
社交媒体有可能提供有关紧急情况和突然事件的及时信息。但是,在每天发布的数百万帖子中找到相关信息可能很困难,并且开发数据分析项目通常需要时间和技术技能。这项研究提出了一种为分析社交媒体的灵活支持的方法,尤其是在紧急情况下。引入了可以采用社交媒体分析的不同用例,并讨论了从大量帖子中检索信息的挑战。重点是分析社交媒体帖子中包含的图像和文本,以及一组自动数据处理工具,用于过滤,分类和使用人类的方法来支持数据分析师的内容。这种支持包括配置自动化工具的反馈和建议,以及众包收集公民的投入。通过讨论Crowd4SDG H2020欧洲项目中开发的三个案例研究来验证结果。
translated by 谷歌翻译
在本文中,我们介绍了TweetNLP,这是社交媒体中自然语言处理(NLP)的集成平台。TweetNLP支持一套多样化的NLP任务,包括诸如情感分析和命名实体识别的通用重点领域,以及社交媒体特定的任务,例如表情符号预测和进攻性语言识别。特定于任务的系统由专门用于社交媒体文本的合理大小的基于变压器的语言模型(尤其是Twitter)提供动力,无需专用硬件或云服务即可运行。TweetNLP的主要贡献是:(1)使用适合社会领域的各种特定于任务的模型,用于支持社交媒体分析的现代工具包的集成python库;(2)使用我们的模型进行无编码实验的交互式在线演示;(3)涵盖各种典型社交媒体应用的教程。
translated by 谷歌翻译
空中操纵器(AM)表现出特别具有挑战性的非线性动力学;无人机和操纵器携带的是一个紧密耦合的动态系统,相互影响。描述这些动力学的数学模型构成了非线性控制和深度强化学习中许多解决方案的核心。传统上,动力学的配方涉及在拉格朗日框架中的欧拉角参数化或牛顿 - 欧拉框架中的四元素参数化。前者的缺点是诞生奇异性,而后者在算法上是复杂的。这项工作提出了一个混合解决方案,结合了两者的好处,即利用拉格朗日框架的四元化方法,将无奇异参数化与拉格朗日方法的算法简单性联系起来。我们通过提供有关运动学建模过程的详细见解以及一般空中操纵器动力学的表述。获得的动力学模型对实时物理引擎进行了实验验证。获得的动力学模型的实际应用显示在计算的扭矩反馈控制器(反馈线性化)的上下文中,我们通过日益复杂的模型分析其实时功能。
translated by 谷歌翻译
具有非平凡大规模拓扑的数据集可能很难嵌入具有现有维度降低算法的低维欧几里得空间中。我们建议使用向量束对拓扑复杂的数据集建模,以使基本空间解释大型拓扑,而纤维则解释了局部几何形状。这使人们可以在保留大规模拓扑的同时降低纤维的尺寸。我们将此观点形式化,并且作为一个应用程序,我们描述了一种算法,该算法将数据集和在欧几里得空间中的初始表示形式一起作为输入,假定其大规模拓扑的一部分,并输出了一种新的表示,并输出一种新的表示形式,该表示是集成了沿着初始全局表示,通过局部线性维度降低获得的局部表示。我们在来自动态系统和化学的示例上证明了这种算法。在这些示例中,与各种基于众所周知的基于度量的降低算法相比,我们的算法能够在较低的目标维度中学习拓扑忠实的数据嵌入。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
移动机器人应该意识到他们的情况,包括对周围环境的深刻理解,以及对自己的状态的估计,成功地做出智能决策并在真实环境中自动执行任务。 3D场景图是一个新兴的研究领域,建议在包含几何,语义和关系/拓扑维度的联合模型中表示环境。尽管3D场景图已经与SLAM技术相结合,以提供机器人的情境理解,但仍需要进一步的研究才能有效地部署它们在板载移动机器人。为此,我们在本文中介绍了一个小说,实时的在线构建情境图(S-Graph),该图在单个优化图中结合在一起,环境的表示与上述三个维度以及机器人姿势一起。我们的方法利用了从3D激光扫描提取的轨道读数和平面表面,以实时构造和优化三层S图,其中包括(1)机器人跟踪层,其中机器人姿势已注册,(2)衡量标准。语义层具有诸如平面壁和(3)我们的新颖拓扑层之类的特征,从而使用高级特征(例如走廊和房间)来限制平面墙。我们的建议不仅证明了机器人姿势估计的最新结果,而且还以度量的环境模型做出了贡献
translated by 谷歌翻译
客户服务Chatbots是对话系统,旨在为客户提供有关不同公司提供的产品/服务的信息。特别地,意图识别是自然语言低估Chatbot系统的能力的核心组件之一。在聊天训练识别的不同意图中,他们有一组是通用的任何客户服务Chatbot。普遍意图可以包括称呼,将对话交给人类代理人,告别。识别这些普遍意图的系统将非常有助于优化特定客户服务聊天训练过程。我们提出了一个普遍意图识别系统的发展,该系统受过培训,以识别28个不同的聊天跳闸中常见的11个意图组。拟议的系统考虑了最先进的单词嵌入模型,例如Word2VEC和BERT,基于卷积和经常性神经网络的深层分类器。所提出的模型能够区分这些普遍意图,均衡精度高达80.4 \%。此外,所提出的系统同样准确地识别短期和长文本请求中表达的意图。同时,错误分类错误通常发生在具有非常相似的语义领域,例如告别和正面评论之间。建议的系统将非常有帮助优化客户服务Chatbot的培训过程,因为我们的系统已经可用并检测到一些意图。与此同时,拟议的方法将是一个合适的基础模型,通过应用转移学习策略培训更具体的聊天措施。
translated by 谷歌翻译
联合学习(FL)可以通过各种不同远程数据源的机器学习模型的分布式计算,而无需将任何单独的数据传输到集中位置。这导致改进的模型的完全性,并且随着更多来源和较大的数据集被添加到联合中的计算和计算的有效缩放。然而,最近的成员攻击表明,当模型参数或摘要统计数据与中央站点共享时,有时可以泄露或推断出私有或敏感的个人数据,需要改进的安全解决方案。在这项工作中,我们提出了一种使用全同性全相治(FHE)的安全FL框架。具体而言,我们使用CKKS构造,近似浮点兼容方案,这些方案受益于密文包装和重新扫描。在我们对大型脑MRI数据集的评估中,我们使用建议的安全流动框架来培训深度学习模型,以预测分布式MRI扫描的一个人的年龄,一个共同的基准测试任务,并证明在学习表现中没有降级在加密和非加密的联合模型之间。
translated by 谷歌翻译
在某些情况下,与机器学习问题有关的数据分布在多个位置,这些位置由于监管,竞争力或隐私原因无法共享数据。需要将数据复制到单个位置的机器学习方法受到数据共享挑战的阻碍。联合学习(FL)是一种在孤岛上所有可用数据的联合模型的有前途的方法。在许多情况下,参与联邦的站点具有不同的数据分布和计算功能。在这些异质环境中,现有的方法表现出较差的性能:同步FL协议是有效的,但学习收敛缓慢,能源成本高;相反,异步FL协议具有更快的收敛性,其能源成本较低,但沟通较高。在这项工作中,我们引入了一种新型的节能半同步联合学习方案,该协议将本地模型定期与最小的闲置时间和快速收敛混合在一起。我们通过在计算机视觉域以及现实世界中生物医学设置中建立的基准数据集进行了广泛的实验,我们的方法在数据和计算异质环境中的先前工作显着优于先前的工作。
translated by 谷歌翻译