智能论文笔记

Reinforcement Learning with Adaptive Curriculum Dynamics Randomization for Fault-Tolerant Robot Control

Wataru Okamoto , Hiroshi Kera , Kazuhiko Kawamoto

分类：机器人 | 人工智能

2021-11-19

本研究旨在解决二次多尺寸机器人到执行器故障的容错问题，这对于在远程或极端环境中运行的机器人至关重要。特别地，建立了具有动态随机化（ACDR）的自适应课程增强学习算法。ACDR算法可以在随机执行器故障条件下自适应地培训四足机器人，并制定一个用于容错机器人控制的单一强大策略。值得注意的是，难以使静止的课程比易于2个课程更有效地用于四足机器人机器人。ACDR算法可用于构建机器人系统，该机器人不需要其他模块检测执行器故障和切换策略。实验结果表明，ACDR算法在平均奖励和步行距离方面优于传统算法。

translated by 谷歌翻译

Neural Controller Synthesis for Signal Temporal Logic Specifications Using Encoder-Decoder Structured Networks

Wataru Hashimoto , Kazumune Hashimoto , Masako Kishida , Shigemasa Takai

分类：机器学习

2022-12-10

In this paper, we propose a control synthesis method for signal temporal logic (STL) specifications with neural networks (NNs). Most of the previous works consider training a controller for only a given STL specification. These approaches, however, require retraining the NN controller if a new specification arises and needs to be satisfied, which results in large consumption of memory and inefficient training. To tackle this problem, we propose to construct NN controllers by introducing encoder-decoder structured NNs with an attention mechanism. The encoder takes an STL formula as input and encodes it into an appropriate vector, and the decoder outputs control signals that will meet the given specification. As the encoder, we consider three NN structures: sequential, tree-structured, and graph-structured NNs. All the model parameters are trained in an end-to-end manner to maximize the expected robustness that is known to be a quantitative semantics of STL formulae. We compare the control performances attained by the above NN structures through a numerical experiment of the path planning problem, showing the efficacy of the proposed approach.

translated by 谷歌翻译

Latent Graph Representations for Critical View of Safety Assessment

Aditya Murali , Deepak Alapatt , Pietro Mascagni , Armine Vardazaryan , Alain Garcia , Nariaki Okamoto , Didier Mutter , Nicolas Padoy

分类：计算机视觉

2022-12-08

Assessing the critical view of safety in laparoscopic cholecystectomy requires accurate identification and localization of key anatomical structures, reasoning about their geometric relationships to one another, and determining the quality of their exposure. In this work, we propose to capture each of these aspects by modeling the surgical scene with a disentangled latent scene graph representation, which we can then process using a graph neural network. Unlike previous approaches using graph representations, we explicitly encode in our graphs semantic information such as object locations and shapes, class probabilities and visual features. We also incorporate an auxiliary image reconstruction objective to help train the latent graph representations. We demonstrate the value of these components through comprehensive ablation studies and achieve state-of-the-art results for critical view of safety prediction across multiple experimental settings.

translated by 谷歌翻译

Langevin Autoencoders for Learning Deep Latent Variable Models

Shohei Taniguchi , Yusuke Iwasawa , Wataru Kumagai , Yutaka Matsuo

分类：机器学习 | (统计)机器学习

2022-09-15

马尔可夫链蒙特卡洛（MCMC），例如langevin Dynamics，有效地近似顽固的分布。但是，由于昂贵的数据采样迭代和缓慢的收敛性，它的用法在深层可变模型的背景下受到限制。本文提出了摊销的langevin Dynamics（ALD），其中数据划分的MCMC迭代完全被编码器的更新替换为将观测值映射到潜在变量中。这种摊销可实现有效的后验采样，而无需数据迭代。尽管具有效率，但我们证明ALD是MCMC算法有效的，其马尔可夫链在轻度假设下将目标后部作为固定分布。基于ALD，我们还提出了一个名为Langevin AutoCodeer（LAE）的新的深层变量模型。有趣的是，可以通过稍微修改传统自动编码器来实现LAE。使用多个合成数据集，我们首先验证ALD可以从目标后代正确获取样品。我们还在图像生成任务上评估了LAE，并证明我们的LAE可以根据变异推断（例如变异自动编码器）和其他基于MCMC的方法在测试可能性方面胜过现有的方法。

translated by 谷歌翻译

Core Challenge 2022: Solver and Graph Descriptions

Takehide Soh , Yoshio Okamoto , Takehiro Ito

分类：人工智能

2022-08-04

本文收集了提交给核心挑战2022的求解器和ISR实例的所有描述。

translated by 谷歌翻译

Quantum Feature Extraction for THz Multi-Layer Imaging

Toshiaki Koike-Akino , Pu Wang , Genki Yamashita , Wataru Tsujita , Makoto Nakajima

分类：机器学习

2022-07-18

最近已将基于学习的THZ多层成像用于非接触式三维（3D）定位和编码。我们通过实验验证，展示了新兴量子机学习（QML）框架的概念验证演示，以应对深度变化，阴影效应和双面内容识别。

translated by 谷歌翻译

Reforming an Envy-Free Matching

Takehiro Ito , Yuni Iwamasa , Naonori Kakimura , Naoyuki Kamiyama , Yusuke Kobayashi , Yuta Nozaki , Yoshio Okamoto , Kenta Ozeki

分类：人工智能

2022-07-06

我们考虑将每个代理分配一个项目时改革无嫉妒的匹配的问题。给定无嫉妒的匹配，我们考虑一个操作，将代理商与代理人首选的未分配项目交换，从而导致另一种无嫉妒的匹配。我们尽可能地重复此操作。我们证明，由此产生的无嫉妒匹配是唯一确定的，可以在选择初始嫉妒的匹配下进行选择，并且可以在多项式时间中找到。我们称之为由此产生的匹配，是一个不正确的嫉妒的匹配，然后我们研究了最短的序列，以从最初的无嫉妒匹配中获得无嫉妒的嫉妒匹配。我们证明，即使每个代理最多接受四个项目，最短的序列在计算上也很难获得，并且每个项目最多都被三个代理所接受。另一方面，当每个代理最多接受三个项目或最多两个代理接受每个项目时，我们给出多项式时间算法。还讨论了不可Ximibibibibibibility和固定参数（IN）的障碍性。

translated by 谷歌翻译

Learning Deep Input-Output Stable Dynamics

Yuji Okamoto , Ryosuke Kojima

分类：机器学习 | 机器人

2022-06-27

从观察到的时间序列数据中学习稳定的动态是机器人技术，物理建模和系统生物学中的重要问题。这些动态中的许多被表示为与外部环境通信的输入输出系统。在这项研究中，我们专注于投入输出稳定系统，表现出对意外刺激和噪声的鲁棒性。我们提出了一种学习保证输入输出稳定性的非线性系统的方法。我们提出的方法利用了满足汉密尔顿 - 雅各比不平等的空间上的可区分投影来实现输入输出稳定性。找到该投影的问题可以作为二次约束二次编程问题，并分析得出特定的解决方案。此外，我们将方法应用于玩具双基生模型以及训练由葡萄糖胰岛素模拟器产生的基准测试的任务。结果表明，通过我们的方法，具有神经网络的非线性系统可以达到输入输出稳定性，这与天真的神经网络不同。我们的代码可在https://github.com/clinfo/deepiostability上找到。

translated by 谷歌翻译

Constructing unbiased gradient estimators with finite variance for conditional stochastic optimization

Takashi Goda , Wataru Kitade

分类： (统计)机器学习

2022-06-04

我们研究了用于解决条件随机优化问题的随机梯度下降，其中要最小化的目标是通过参数嵌套期望给出的，相对于一个随机变量，与另一个随机变量相对于一个随机变量和内部条件期望进行了外部期望。这种参数嵌套期望的梯度再次表示为嵌套期望，这使得标准嵌套的蒙特卡洛估计量很难公正。在本文中，我们在某些条件下表明，多级蒙特卡洛梯度估计器是公正的，并且具有有限的方差和有限的预期计算成本，因此直接适用了参数（非嵌套）期望的随机优化的标准理论。我们还讨论了一个特殊情况，可以为此构建另一个具有有限差异和成本的公正梯度估计器。

translated by 谷歌翻译

Temporally Constrained Neural Networks (TCNN): A framework for semi-supervised video semantic segmentation

Deepak Alapatt , Pietro Mascagni , Armine Vardazaryan , Alain Garcia , Nariaki Okamoto , Didier Mutter , Jacques Marescaux , Guido Costamagna , Bernard Dallemagne , Nicolas Padoy

分类：计算机视觉 | 神经与进化计算

2021-12-27

为有效语义分割和特别是视频语义分割构建模型的主要障碍是缺乏大型和良好的注释数据集。这种瓶颈在高度专业化的和监管领域特别禁止，例如医学和手术，视频语义细分可能具有重要应用，但数据和专家注释是稀缺的。在这些设置中，可以在培训期间利用时间线索和解剖结构来提高性能。在这里，我们呈现时间限制的神经网络（TCNN），是用于外科视频的视频语义分割的半监督框架。在这项工作中，我们表明AutoEncoder网络可用于有效地提供空间和时间监控信号来培训深度学习模型。我们在新推出的腹腔镜胆囊切除术文程序，内测序和对CADIS，CADIS的公共数据集的适应时测试我们的方法。我们证明，可以利用预测面罩的较低尺寸表示，以在稀疏标记的数据集中提供一致的改进，这些数据集在推理时间不具有额外的计算成本。此外，TCNN框架是模型无关的，可以与其他模型设计选择结合使用，具有最小的额外复杂性。

translated by 谷歌翻译