智能论文笔记

DEFT: Diverse Ensembles for Fast Transfer in Reinforcement Learning

Simeon Adebola , Satvik Sharma , Kaushik Shivakumar

分类：机器学习 | 人工智能

2022-09-26

已经证明，深层合奏将典型的集体学习中看到的积极效果扩展到神经网络和增强学习（RL）。但是，要提高此类整体模型的效率仍然有很多事情要做。在这项工作中，我们介绍了在RL（feft）中快速传输的各种合奏，这是一种基于合奏的新方法，用于在高度多模式环境中进行增强学习，并改善了转移到看不见的环境。该算法分为两个主要阶段：合奏成员的培训，以及合成成员的合成（或微调）成员，以在新环境中起作用。该算法的第一阶段涉及并行培训常规的政策梯度或参与者 - 批评者，但增加了鼓励这些政策彼此不同的损失。这会导致单个单峰剂探索最佳策略的空间，并捕获与单个参与者相比，捕获环境的多模式的更多。 DEFT的第二阶段涉及将组件策略综合为新的策略，该策略以两种方式之一在修改的环境中效果很好。为了评估DEFT的性能，我们从近端策略优化（PPO）算法的基本版本开始，并通过faft的修改将其扩展。我们的结果表明，预处理阶段可有效地在多模式环境中产生各种策略。除了替代方案，faft通常会收敛到高奖励的速度要快得多，例如随机初始化而无需faft和合奏成员的微调。虽然当然还有更多的工作来分析理论上的熟练并将其扩展为更强大，但我们认为，它为在环境中捕获多模式的框架提供了一个强大的框架，同时仍将使用简单策略表示的RL方法。

translated by 谷歌翻译

Automated Pruning of Polyculture Plants

Mark Presten , Rishi Parikh , Shrey Aeron , Sandeep Mukherjee , Simeon Adebola , Satvik Sharma , Mark Theis , Walter Teitelbaum , Ken Goldberg

分类：机器人 | 人工智能

2022-08-22

多养殖养殖具有环境优势，但比单一养殖需要更修剪。我们介绍用于自动修剪的新型硬件和算法。自主系统使用高架摄像头从物理规模的花园测试床中收集数据，利用学识渊博的植物表型卷积神经网络和边界磁盘跟踪算法来评估单个植物分布并每天估算花园的状态。从这个花园状态下，Alphagardensim选择植物自主修剪。训练有素的神经网络检测并靶向工厂上的特定修发点。实验评估了两种与农业机器人龙门系统兼容的定制设计的修剪工具，并通过受控算法进行了自主削减。我们提出了四个60天的花园周期的结果。结果表明，该系统可以自主实现0.94个归一化的植物多样性，并在修剪剪切的同时保持平均冠层覆盖率为0.84，到周期结束时。有关代码，视频和数据集，请参见https：//sites.google.com/berkeley.edu/pruningpolyculture。

translated by 谷歌翻译

AlphaGarden: Learning to Autonomously Tend a Polyculture Garden

Mark Presten , Yahav Avigal , Mark Theis , Satvik Sharma , Rishi Parikh , Shrey Aeron , Sandeep Mukherjee , Sebastian Oehme , Simeon Adebola , Walter Teitelbaum

分类：机器人 | 人工智能

2021-11-11

本文展示了alphaRARDEN：一个自治的多种植花园，在1.5米×3.0米的物理测试平台中撒上和灌溉生物植物。alphanArden使用架空相机和传感器来跟踪植物分布和土壤水分。我们模拟个体植物生长和平面动态，以培训选择行动以最大化叶片覆盖和多样性的政策。对于自主修剪，alphanarden使用两个定制的修剪工具和训练有素的神经网络来检测紫杉角。我们为四个60天的花园周期提供了结果。结果表明，alphaRARARDEN可以自主地实现0.96个归一化多样性，在循环峰值期间保持0.86的平均冠层覆盖率。可以在https://github.com/berkeleyautomation/alpharden找到代码，数据集和补充材料。

translated by 谷歌翻译

VAESim: A probabilistic approach for self-supervised prototype discovery

Matteo Ferrante , Tommaso Boccato , Simeon Spasov , Andrea Duggento , Nicola Toschi

分类：计算机视觉 | 机器学习

2022-09-25

在医学中，精心策划的图像数据集经常采用离散标签来描述所谓的健康状况与病理状况的连续光谱，例如阿尔茨海默氏病连续体或图像在诊断中起关键点的其他领域。我们提出了一个基于条件变异自动编码器的图像分层的体系结构。我们的框架VAESIM利用连续的潜在空间来表示疾病的连续体并在训练过程中找到簇，然后可以将其用于图像/患者分层。该方法的核心学习一组原型向量，每个向量与群集关联。首先，我们将每个数据样本的软分配给群集。然后，我们根据样品嵌入和簇的原型向量之间的相似性度量重建样品。为了更新原型嵌入，我们使用批处理大小中实际原型和样品之间最相似表示的指数移动平均值。我们在MNIST手写数字数据集和名为Pneumoniamnist的医疗基准数据集上测试了我们的方法。我们证明，我们的方法在两个数据集中针对标准VAE的分类任务（性能提高了15％）的KNN准确性优于基准，并且还以完全监督的方式培训的分类模型同等。我们还展示了我们的模型如何优于无监督分层的当前，端到端模型。

translated by 谷歌翻译

Contrastive learning for unsupervised medical image clustering and reconstruction

Matteo Ferrante , Tommaso Boccato , Simeon Spasov , Andrea Duggento , Nicola Toschi

分类：计算机视觉 | 机器学习

2022-09-24

与临床上建立的疾病类别相比，缺乏大型标记的医学成像数据集以及个体间的显着可变性，在精确医学范式中利用医学成像信息方面面临重大挑战个体预测和/或将患者分为较细粒的群体，这些群体可能遵循更多均匀的轨迹，从而赋予临床试验能力。为了有效地探索以无监督的方式探索医学图像中有效的自由度可变性，在这项工作中，我们提出了一个无监督的自动编码器框架，并增加了对比度损失，以鼓励潜在空间中的高可分离性。该模型在（医学）基准数据集上进行了验证。由于群集标签是根据集群分配分配给每个示例的，因此我们将性能与监督的转移学习基线进行比较。我们的方法达到了与监督体系结构相似的性能，表明潜在空间中的分离再现了专家医学观察者分配的标签。所提出的方法可能对患者分层有益，探索较大类或病理连续性的新细分，或者由于其在变化环境中的采样能力，因此医学图像处理中的数据增强。

translated by 谷歌翻译