在工业4.0中,现代制造和自动化工作场所的剩余寿命(RUL)预测至关重要。显然,这是连续的工具磨损,或更糟糕的是,突然的机器故障会导致各种制造故障,这显然会导致经济损失。借助深度学习方法的可用性,将其用于RUL预测的巨大潜力和前景导致了几种模型,这些模型是由制造机的操作数据驱动的。目前,基于完全监督模型的这些努力严重依赖于其规定标记的数据。但是,只有在机器崩溃发生后才能获得所需的RUL预测数据(即来自错误和/或降解机器的注释和标记的数据)。现代制造和自动化工作场所中破碎的机器在现实情况下的稀缺性增加了获得足够注释和标记数据的困难。相比之下,从健康机器中收集的数据要容易得多。因此,我们指出了这一挑战以及提高有效性和适用性的潜力,因此我们提出(并充分开发)一种基于掩盖自动编码器的概念的方法,该方法将利用未标记的数据进行自学。因此,在这里的工作中,开发和利用了一种值得注意的掩盖自我监督的学习方法。这旨在通过利用未标记的数据来建立一个深度学习模型,以实现RUL预测。在C-MAPSS数据集中实施了验证该开发有效性的实验(这些实验是从NASA Turbofan发动机的数据中收集的)。结果清楚地表明,与使用全面监督模型相比,我们在这里的发展和方法在准确性和有效性上都表现得更好。
translated by 谷歌翻译
3D零件分割是高级CAM/CAD工作流程中的重要步骤。精确的3D细分有助于降低制造设备(例如计算机控制的CNC)生产的工作配件的缺陷率,从而提高了工作效率并获得了随之而来的经济利益。在3D模型分割上进行的大量现有作品主要基于完全监督的学习,该学习训练AI模型具有大型,带注释的数据集。但是,缺点是,完全监督的学习方法的最终模型高度依赖于可用数据集的完整性,并且其概括能力对新的未知细分类型(即其他新颖的类别)相对较差。在这项工作中,我们提出并开发了一种值得注意的基于学习的方法,以在CAM/CAD中进行有效的部分分割;这旨在显着增强其概括能力,并通过仅使用相对较少的样本灵活地适应新的分割任务。结果,它不仅减少了通常无法实现和详尽的监督数据集完整性的要求,而且还提高了对现实世界应用程序的灵活性。作为进一步的改进和创新,我们还采用了网络中的转换网和中心损失块。这些特征有助于提高整个工作人员各种可能实例的3D特征的理解,并确保在特征空间中同一类的密切分布。此外,我们的方法以降低空间消耗的点云格式存储数据,并且还使所涉及的各种过程变得更加容易阅读和编辑访问(从而提高了效率和有效性并降低了成本)。
translated by 谷歌翻译
R2是一种新颖的在线任何角度路径计划者,它使用基于启发式错误或射线铸造方法在具有非凸线,多边形障碍物的2D地图中找到最佳路径。R2与传统的自由空间计划者具有竞争力,如果查询具有直接视线,请迅速找到路径。在很少有障碍轮廓的大稀疏地图上,在实践中可能会发生,R2的表现要优于自由空间规划师,并且可能比最先进的自由空间扩展计划者Anya快得多。在带有许多轮廓的地图上,Anya的性能比R2快。R2建立在Rayscan上,引入了懒惰搜索和源 - 路边计数器,可在连续的轮廓上乐观地找到继任者。这种新颖的方法绕过了锯齿状轮廓上的大多数继任者,以减少昂贵的视线检查,因此不需要预处理才能成为在线竞争性的任何角度策划者。
translated by 谷歌翻译
对外部干扰的估计和反应对于对准轮运动器的鲁棒控制是根本的重要性。现有估计人通常需要大量数据,包括地面真理的大量数据,以实现令人满意的性能。本文提出了一种数据有效的可微分运动地平线估计(DMHE)算法,可以在线自动调整MHE参数,并适应不同的场景。我们通过从MHE相对于调谐参数导出估计的轨迹的分析梯度来实现这一点,使能够进行自动调整的端到端学习。最有趣的是,我们表明可以从递归形式的卡尔曼滤波器有效地计算梯度。此外,我们开发了一种基于模型的策略梯度算法,可以直接从轨迹跟踪误差中学习参数,而无需对实际真理。所提出的DMHE可以进一步嵌入为具有用于联合优化的其他神经网络的层。最后,我们通过在四轮官上的模拟和实验中展示了所提出的方法的有效性,其中检查了突然有效载荷变化和飞行中的具有挑战性的情景。
translated by 谷歌翻译
迭代线性二次调节器(ILQR)在解决非线性系统模型的轨迹优化问题方面已广泛普及。但是,作为一种基于模型的拍摄方法,它在很大程度上依赖于准确的系统模型来更新最佳控制动作和通过正向集成确定的轨迹,从而变得容易受到不可避免的模型的影响。最近,针对最佳控制问题的基于学习的方法进行的大量研究工作在解决未知系统模型方面已经取得了显着发展,尤其是当系统与环境具有复杂的相互作用时。然而,通常需要一个深层的神经网络来拟合大量的采样数据。在这项工作中,我们提出了神经-ILQR,这是一种在不受约束的控制空间上进行学习的拍摄方法,其中使用简单结构的神经网络代表局部系统模型。在此框架中,通过同时完善最佳策略和神经网络迭代,可以实现轨迹优化任务,而无需依靠系统模型的先验知识。通过对两项说明性控制任务的全面评估,在系统模型中存在不准确性的情况下,提出的方法显示出胜过常规ILQR。
translated by 谷歌翻译
在自主驾驶的背景下,已知迭代线性二次调节器(ILQR)是在运动计划问题中处理非线性车辆模型的有效方法。特别是,受约束的ILQR算法在不同类型的一般限制下实现运动计划任务方面表现出了值得注意的计算效率结果。但是,受约束的ILQR方法需要在使用对数屏障函数时在第一次迭代时作为先决条件进行可行的轨迹。同样,该方法为纳入快速,高效和有效的优化方法开辟了可能性,以进一步加快优化过程,从而可以成功地满足实时实施的要求。在本文中,定义明确的运动计划问题是在非线性车辆动力学和各种约束下提出的,并利用了乘数的交替方向方法来确定利用ILQR的最佳控制动作。该方法能够在第一次迭代时规避轨迹的可行性要求。然后研究了自动驾驶汽车运动计划的说明性示例。拟议的开发实现了高度计算效率的值得注意的成就。与基于对数屏障函数的约束ILQR算法进行比较,我们提出的方法在三种驾驶场景中,平均计算时间降低了31.93%,38.52%和44.57%;与优化求解器IPOPT相比,我们提出的方法将平均计算时间降低了46.02%,53.26%和88.43%。结果,可以通过我们提出的框架实现实时计算和实施,因此它为公路驾驶任务提供了额外的安全性。
translated by 谷歌翻译
Video super-resolution is one of the most popular tasks on mobile devices, being widely used for an automatic improvement of low-bitrate and low-resolution video streams. While numerous solutions have been proposed for this problem, they are usually quite computationally demanding, demonstrating low FPS rates and power efficiency on mobile devices. In this Mobile AI challenge, we address this problem and propose the participants to design an end-to-end real-time video super-resolution solution for mobile NPUs optimized for low energy consumption. The participants were provided with the REDS training dataset containing video sequences for a 4X video upscaling task. The runtime and power efficiency of all models was evaluated on the powerful MediaTek Dimensity 9000 platform with a dedicated AI processing unit capable of accelerating floating-point and quantized neural networks. All proposed solutions are fully compatible with the above NPU, demonstrating an up to 500 FPS rate and 0.2 [Watt / 30 FPS] power consumption. A detailed description of all models developed in the challenge is provided in this paper.
translated by 谷歌翻译
3D漫画是对人脸的夸张的3D描述。本文的目的是对紧凑的参数空间中的3D漫画的变化进行建模,以便我们可以为处理3D漫画变形提供有用的数据驱动工具包。为了实现目标,我们提出了一个基于MLP的框架,用于构建可变形的表面模型,该模型采用潜在代码并产生3D表面。在框架中,警笛MLP模拟了在固定模板表面上采用3D位置并返回输入位置的3D位移向量的函数。我们通过学习采用潜在代码并产生MLP参数的超网络来创建3D表面的变化。一旦了解到,我们的可变形模型为3D漫画提供了一个不错的编辑空间,支持基于标签的语义编辑和基于尖的基于尖的变形,这两者都产生了高度夸张和自然的3D讽刺形状。我们还展示了可变形模型的其他应用,例如自动3D漫画创建。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
Tiktok是一个受欢迎的新社交媒体,用户通过短视频剪辑表达自己。平台上的常见互动形式参与了“挑战”,这是用户迭代的歌曲和舞蹈。挑战传染可以通过复制范围来衡量,即用户上传他们参与挑战的视频。 Tiktok平台的唯一性,其中挑战内容和用户偏好都在不断发展,需要挑战和用户表示的组合。本文通过预测用户的参与调查Tiktok挑战的社会传染。我们提出了一种新的深度学习模型,深度学习模型,学习和组合潜在的用户和挑战表格,以执行此用户挑战预测任务。我们从Fortoupage,App的登陆页面上的12个趋势挑战收集超过7,000个视频的数据集,从1303名用户提供超过10,000个视频。进行了广泛的实验,结果表明,我们所提出的Deepballenger(F1 = 0.494)在预测任务中优于基线(F1 = 0.188)。
translated by 谷歌翻译