智能论文笔记

Visual processing in context of reinforcement learning

Hlynur Davíð Hlynsson

分类：机器学习

2022-08-26

尽管深度强化学习（RL）最近取得了许多成功，但其方法仍然效率低下，这使得在数据方面解决了昂贵的许多问题。我们的目标是通过利用未标记的数据中的丰富监督信号来进行学习状态表示，以解决这一问题。本文介绍了三种不同的表示算法，可以访问传统RL算法使用的数据源的不同子集使用：（i）GRICA受到独立组件分析（ICA）的启发，并训练深层神经网络以输出统计独立的独立特征。输入。 Grica通过最大程度地减少每个功能与其他功能之间的相互信息来做到这一点。此外，格里卡仅需要未分类的环境状态。（ii）潜在表示预测（LARP）还需要更多的上下文：除了要求状态作为输入外，它还需要先前的状态和连接它们的动作。该方法通过预测当前状态和行动的环境的下一个状态来学习状态表示。预测器与图形搜索算法一起使用。（iii）重新培训通过训练深层神经网络来学习国家表示，以学习奖励功能的平滑版本。该表示形式用于预处理输入到深度RL，而奖励预测指标用于奖励成型。此方法仅需要环境中的状态奖励对学习表示表示。我们发现，每种方法都有其优势和缺点，并从我们的实验中得出结论，包括无监督的代表性学习在RL解决问题的管道中可以加快学习的速度。

translated by 谷歌翻译

HTML版本

临床文本注释（CTN）包含医生的推理过程，以非结构化的自由文本格式编写，他们检查和采访患者。近年来，已经发表了几项研究，这些研究为机器学习的实用性提供了证据，以预测CTN的医生诊断，这是一项称为ICD编码的任务。数据注释很耗时，尤其是在需要一定程度的专业化时，就像医疗数据一样。本文提出了一种以半自我监督的方式增强冰岛CTN的稀疏注释数据集的方法。我们在一小部分带注释的CTN上训练神经网络，并使用它从一组未通畅的CTN中提取临床特征。这些临床特征包括对医生可能会在患者咨询期间找到答案的大约一千个潜在问题的答案。然后，这些功能用于训练分类器以诊断某些类型的疾病。我们报告了对医生的三个数据可用性评估该数据增强方法的评估结果。我们的数据增强方法显示出显着的积极作用，当检查患者和诊断的临床特征时，这会减少。我们建议使用基于不包括考试或测试的临床特征做出决策的系统增强稀缺数据集的方法。

translated by 谷歌翻译

视觉奇数任务被认为是对人类的普遍独立的分析智能测试。人工智能的进步导致了重要的突破，但是与人类在此类分析智能任务上竞争仍然具有挑战性，并且通常诉诸于非生物学上的架构。我们提出了一个具有生物学现实的系统，该系统从合成眼动运动中接收输入 - 扫视，并与结合新皮质神经元动力学的神经元一起处理它们。我们介绍了一个程序生成的视觉奇数数据集，以训练扩展常规关系网络和我们建议的系统的体系结构。两种方法都超过了人类的准确性，我们发现两者都具有相同的基本推理基本机制。最后，我们表明，具有生物学启发的网络可实现卓越的准确性，学习速度更快，所需的参数比常规网络更少。

translated by 谷歌翻译