Paris-Carla-3d是由移动激光器和相机系统构建的几个浓彩色点云的数据集。数据由两组具有来自开源Carla模拟器(700百万分)的合成数据和在巴黎市中获取的真实数据(6000万分),因此Paris-Carla-3d的名称。此数据集的一个优点是在开源Carla模拟器中模拟了相同的LIDAR和相机平台,因为用于生产真实数据的开源Carla Simulator。此外,使用Carla的语义标记的手动注释在真实数据上执行,允许将转移方法从合成到实际数据进行测试。该数据集的目的是提供一个具有挑战性的数据集,以评估和改进户外环境3D映射的困难视觉任务的方法:语义分段,实例分段和场景完成。对于每项任务,我们描述了评估协议以及建立基线的实验。
translated by 谷歌翻译
从自然语言中提取正式知识(本体论)是一个挑战,可以从语义层面上从(半)正式语言表征中受益。我们建议通过在RDF之上实施通用网络语言(UNL)规范来实现这样的代表。因此,任何语言中的陈述的含义都会被声称为RDF-UNL图形,构成自然语言与正式知识之间的中间地面。特别是,我们表明RDF-UNL图表可以使用通用Shacl规则支持内容提取,并且提取的事实上的推理允许检测原始文本中的不一致。这种方法是在UNSELER项目中试验,该项目旨在从系统要求/规格中提取本体论,以检查它们是一致的,完整和明确的。我们的RDF-UNL实施和本文的工作示例的所有代码在HTTPS://gitlab.tetras-libre.fr/unl/rdf-unl上公开可用于Cecill-B许可证下
translated by 谷歌翻译
作物现场边界有助于映射作物类型,预测产量,并向农民提供现场级分析。近年来,已经看到深深学习的成功应用于划定工业农业系统中的现场边界,但由于(1)需要高分辨率卫星图像的小型字段来解除界限和(2)缺乏(2)缺乏用于模型培训和验证的地面标签。在这项工作中,我们结合了转移学习和弱监督来克服这些挑战,我们展示了在印度的成功方法,我们有效地产生了10,000个新的场地标签。我们最好的型号使用1.5亿分辨率的空中客车现货图像作为投入,预先列进法国界限的最先进的神经网络,以及印度标签上的微调,以实现0.86的联盟(iou)中位数交叉口在印度。如果使用4.8M分辨率的行星扫描图像,最好的模型可以实现0.72的中位数。实验还表明,法国的预训练减少了所需的印度现场标签的数量,以便在数据集较小时尽可能多地实现给定的性能水平。这些发现表明我们的方法是划定当前缺乏现场边界数据集的世界区域中的裁剪领域的可扩展方法。我们公开发布了10,000个标签和描绘模型,以方便社区创建现场边界地图和新方法。
translated by 谷歌翻译
横梁面部识别(CFR)旨在识别个体,其中比较面部图像源自不同的感测模式,例如红外与可见的。虽然CFR由于与模态差距相关的面部外观的显着变化,但CFR具有比经典的面部识别更具挑战性,但它在具有有限或挑战的照明的场景中,以及在呈现攻击的情况下,它是优越的。与卷积神经网络(CNNS)相关的人工智能最近的进展使CFR的显着性能提高了。由此激励,这项调查的贡献是三倍。我们提供CFR的概述,目标是通过首先正式化CFR然后呈现具体相关的应用来比较不同光谱中捕获的面部图像。其次,我们探索合适的谱带进行识别和讨论最近的CFR方法,重点放在神经网络上。特别是,我们提出了提取和比较异构特征以及数据集的重新访问技术。我们枚举不同光谱和相关算法的优势和局限性。最后,我们讨论了研究挑战和未来的研究线。
translated by 谷歌翻译
最近关于机器学习和优化集成的研究的扩散。该研究流中的一个膨胀区域是预测模型嵌入式优化,其使用预先接受训练的预测模型来实现优化问题的目标函数,因此预测模型的特征成为优化问题中的决策变量。尽管该领域最近出版物飙升,但这一决策管道的一个方面已经很大程度上被忽视的是培训相关性,即确保对优化问题的解决方案应该类似于用于训练预测模型的数据。在本文中,我们提出了旨在实施培训相关性的限制,并通过集合来展示添加建议的约束显着提高所获得的溶液质量。
translated by 谷歌翻译
量子计算是使用量子力学执行计算的过程。该领域研究某些亚杀菌粒子的量子行为,以便随后在执行计算,以及大规模信息处理中使用。这些能力可以在计算时间和经典计算机上的成本方面提供量子计算机的优势。如今,由于计算复杂性或计算所需的时间,具有科学挑战,这是由于古典计算而无法执行,并且量子计算是可能的答案之一。然而,电流量子器件尚未实现必要的QUBITS,并且没有足够的容错才能实现这些目标。尽管如此,还有其他领域,如机器学习或化学,其中量子计算对电流量子器件有用。本手稿旨在展示2017年和2021年之间发布的论文的系统文献综述,以确定,分析和分类量子机器学习和其应用中使用的不同算法。因此,该研究确定了使用量子机器学习技术和算法的52篇文章。发现算法的主要类型是经典机器学习算法的量子实现,例如支持向量机或K最近邻模型,以及古典的深度学习算法,如量子神经网络。许多文章试图解决目前通过古典机器学习回答的问题,但使用量子设备和算法。即使结果很有希望,量子机器学习也远未实现其全部潜力。由于现有量子计算机缺乏足够的质量,速度和比例以允许量子计算来实现其全部潜力,因此需要提高量子硬件。
translated by 谷歌翻译
在这项工作中,我们介绍了配备有明确性能的第一个初始化方法,该方法适用于姿势图同时定位和映射(SLAM)和旋转平均(RA)问题。 SLAM和旋转平均通常正义为大规模的非渗透点估计问题,具有许多糟糕的本地最小值,可以捕获通常应用的平滑优化方法来解决它们;因此,标准SLAM和RA算法的性能至关重要取决于用于初始化该本地搜索的估计的质量。虽然在文献中出现了SLAM和RA的许多初始化方法,但通常可以获得纯粹的启发式近似值,这使得难以确定是否(或在什么情况下)这些技术可以可靠地部署这些技术。相比之下,在这项工作中,我们研究通过光谱松弛镜头初始化的问题。具体而言,我们推出了SLAM和RA的简单谱弛豫,其形式使我们能够利用经典的线性代数技术(特征向量扰动界限)来控制从我们的光谱估计到(未知)地基实际和该距离作为测量噪声的函数的估计问题的全局最小化器。我们的结果揭示了测量网络在控制估计精度下播放的光谱图 - 理论性能的关键作用;此外,作为我们分析的副产物,我们在估计误差上获得了最大似然估计的估计误差,这可能具有独立兴趣。最后,我们在实验上展示了我们的光谱估计器在实践中非常有效,与现有的最先进技术相比,在较低的计算成本下生产可比或优异质量的初始化。
translated by 谷歌翻译
深度加强学习是一种越来越流行的技术,用于综合政策以控制代理商与其环境的互动。正式验证此类策略是否正确并安全执行,并且安全地执行兴趣。通过建立现有工作来验证深神经网络和连续状态动态系统的现有工作,已经在这方面取得了进展。在本文中,我们解决了验证深度加强学习的概率政策的问题,这些政策用于例如解决对抗性环境,破坏对称和管理权衡。我们提出了一种基于间隔马尔可夫决策过程的抽象方法,它会产生策略的执行上的概率保证,并使用抽象解释,混合整数线性编程,基于熵的细化和概率模型检查来构建和解决这些模型的概率保证。我们实施了我们的方法,并说明了它在选择加强学习基准的效力。
translated by 谷歌翻译
Covid-19的早期检测是一个持续的研究领域,可以帮助潜在患者的潜在患者进行分类,监测和一般健康评估,并可能降低应对冠状病毒大流行病的医院的运营压力。在文献中使用了不同的机器学习技术,用于使用常规临床数据(血液测试和生命体征)来检测冠状病毒。使用这些型号时,数据漏洞和信息泄漏可以带来声誉损害并导致医院的法律问题。尽管如此,保护避免潜在敏感信息泄漏的医疗保健模型是一个被人吸引人的研究区。在这项工作中,我们检查了两种机器学习方法,旨在预测使用常规收集和易于使用的临床数据的患者的Covid-19状态。我们雇用对抗性培训来探索强大的深度学习架构,保护与有关患者的人口统计信息相关的属性。我们在这项工作中检查的两种模型旨在保持对抗对抗攻击和信息泄漏的敏感信息。在一系列使用来自牛津大学医院的数据集,Bedfordshire医院NHS Foundation Trust,大学医院伯明翰NHS基金会信托,而朴茨茅斯医院大学NHS信任我们训练并测试两个神经网络,以使用来自基本实验室血液的信息预测PCR测试结果的神经网络对患者到达医院的测试和生命体征。我们评估其每个模型的隐私水平可以提供和展示我们提出的架构对可比基线的效力和稳健性。我们的主要贡献之一是,我们专门针对具有内置机制的有效Covid-19检测模型的开发,以便选择性地保护对抗对抗攻击的敏感属性。
translated by 谷歌翻译
确保未来变革性人工智能(TAI)或人工高智(ASI)系统的安全性存在几种不同的方法,以及不同方法的支持者对其在近期工作的重要性或有用性具有不同和辩论的索赔,以及未来的系统。高度可靠的代理设计(HRAD)是由机器智能研究所等领域的最具争议和雄心勃勃的方法之一,其中包括各种论点以及如何减少未来AI系统的风险。为了减少关于AI安全的辩论中的困惑,在这里,我们在米饭上建立了以前的讨论,该米饭收集并提出了四个中央论点,这些论点用于证明HRAD作为AI系统安全的路径。我们签下了争论(1)附带效用,(2)碎片灌注,(3)精确规范,(4)预测。这些中的每一个都具有不同的,部分冲突的索赔关于未来AI系统可能是风险的。我们已经根据发布和非正式文献的审查,并与对该主题职位的专家进行磋商,解释了假设和索赔。最后,我们简要概述了针对每种方法和整体议程的论据。
translated by 谷歌翻译