智能论文笔记

Symbolic Explanation of Affinity-Based Reinforcement Learning Agents with Markov Models

Charl Maree , Christian W. Omlin

分类：机器学习 | 人工智能

2022-08-26

人工智能的扩散越来越依赖于模型理解。理解既需要一种解释 - 关于模型行为的人类推理，又是解释 - 模型功能的象征性表示。尽管必须对安全性，信任和接受的透明度，但最先进的强化学习算法的不透明性掩盖了其学习策略的基础。我们已经开发了一种政策正规化方法，该方法主张了学识渊博的策略的全球固有亲和力。这些亲和力提供了一种关于政策行为的推理手段，从而使其固有地解释。我们已经在个性化的繁荣管理中展示了我们的方法，其中个人的支出行为及时决定了他们的投资策略，即不同的支出人物可能与不同的投资类别有不同的关联。现在，我们通过使用离散的Markov模型重现潜在的原型策略来解释我们的模型。这些全球替代物是原型政策的符号表示。

translated by 谷歌翻译

HTML版本

Reinforcement Learning with Intrinsic Affinity for Personalized Prosperity Management

Charl Maree , Christian W. Omlin

分类：机器学习 | 人工智能

2022-04-20

将强化学习（RL）应用于资产管理的共同目的是利润的最大化。用于学习最佳策略的外部奖励功能通常不会考虑任何其他偏好或约束。我们已经开发了一种正则化方法，该方法可确保策略具有全球固有亲和力，即，不同的个性可能对某些资产可能会随着时间而改变。我们利用这些内在政策亲和力，使我们的RL模型固有地解释。我们演示了如何对RL代理进行培训，以为特定的个性概况编排此类政策，并仍然获得高回报。

translated by 谷歌翻译

Understanding Spending Behavior: Recurrent Neural Network Explanation and Interpretation

Charl Maree , Christian W. Omlin

分类：机器学习 | 人工智能

2021-09-24

金融部门客户的微分是一个非琐碎的任务，近期科学文学一直是一项非典型的遗漏。如果传统分割根据人口统计数据等粗略特征对客户进行分类，则微分内容描绘了个体之间的更细致的差异，提出了几个优点，包括改进金融服务中个性化的潜力。 AI和代表学习提供了解决微分段问题的独特机会。虽然在许多行业普遍存在，但金融等敏感产业的AI扩散已经取决于深层模型的解释性。我们之前通过从经常性神经网络（RNN）的状态空间提取了时间特征来解决了微分段问题。但是，由于RNN的固有不透明度，我们的解决方案缺乏解释。在本研究中，我们通过提取我们模型的符号解释并提供对我们的时间特征的解释来解决这个问题。为了解释，我们使用线性回归模型来重建具有高保真度的状态空间中的功能。我们表明我们的线性回归系数不仅了解了用于重新创建功能的规则，而且还学习了在原始数据中直接明显的关系。最后，我们提出了一种新的方法，通过使用逆回归和动态系统来定位和标记一组吸引子来解释状态空间的动态。

translated by 谷歌翻译

Towards Artificial Virtuous Agents: Games, Dilemmas and Machine Learning

Ajay Vishwanath , Einar Duenger Bøhn , Ole-Christoffer Granmo , Charl Maree , Christian Omlin

分类：人工智能

2022-08-30

由于需要确保安全可靠的人工智能（AI），因此在过去几年中，机器伦理学受到了越来越多的关注。这两种在机器伦理中使用的主要理论是道义和功利主义伦理。另一方面，美德伦理经常被称为另一种伦理理论。尽管这种有趣的方法比流行的道德理论具有一定的优势，但由于其形式化，编纂和解决道德困境以训练良性剂的挑战，工程人工贤惠的媒介几乎没有努力。我们建议通过使用充满道德困境的角色扮演游戏来弥合这一差距。有几种这样的游戏，例如论文，生活很奇怪，主要角色遇到的情况必须通过放弃对他们所珍视的其他东西来选择正确的行动方案。我们从此类游戏中汲取灵感，以展示如何设计系统的角色扮演游戏来发展人造代理中的美德。使用现代的AI技术，例如基于亲和力的强化学习和可解释的AI，我们激励了扮演这种角色扮演游戏的良性代理，以及通过美德道德镜头对他们的决策进行检查。这种代理和环境的发展是朝着实际上正式化和证明美德伦理在伦理代理发展的价值的第一步。

translated by 谷歌翻译

OpenSRH: optimizing brain tumor surgery using intraoperative stimulated Raman histology

Cheng Jiang , Asadur Chowdury , Xinhai Hou , Akhil Kondepudi , Christian W. Freudiger , Kyle Conway , Sandra Camelo-Piragua , Daniel A. Orringer , Honglak Lee , Todd C. Hollon

分类：计算机视觉 | 机器学习

2022-06-16

准确的术中诊断对于在脑肿瘤手术期间提供安全有效的护理至关重要。我们的护理标准诊断方法是时间，资源和劳动密集型，限制了获得最佳手术治疗的机会。为了解决这些局限性，我们提出了一种替代工作流程，该工作流程结合了刺激的拉曼组织学（SRH），一种快速的光学成像方法，以及对SRH图像的深层自动解释，用于术中脑肿瘤诊断和实时手术决策支持。在这里，我们介绍了OpenSRH，这是来自300多名脑肿瘤患者和1300多个独特全幻灯片光学图像的第一个公共数据集。 OPENSRH包含来自最常见的脑肿瘤诊断，完整的病理注释，整个幻灯片肿瘤分割，原始和加工的光学成像数据的数据，用于端到端模型的开发和验证。我们为使用弱（即患者级）诊断标签的基于补丁的整个幻灯片分类和推断提供了一个框架。最后，我们基准了两项计算机视觉任务：多类组织学脑肿瘤分类和基于斑块的对比表示学习。我们希望OpenSRH能够促进快速光学成像和基于ML的手术决策支持的临床翻译，以提高精密医学时代的癌症手术的获取，安全性和功效。数据集访问，代码和基准可在opensrh.mlins.org上找到。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Can Interpretable Reinforcement Learning Manage Prosperity Your Way?

Charl Maree , Christian Omlin

分类：机器学习 | 人工智能

2022-02-18

产品和服务的个性化正在迅速成为银行和商业成功的驱动力。机器学习具有对客户需求和偏好的更深入了解和量身定制的希望。尽管对财务决策问题的传统解决方案经常依赖于模型假设，但强化学习能够利用大量数据，以改善具有更少假设的复杂财务环境中的客户建模和决策。从监管的角度来看，解释性和可解释性提出了挑战，要求接受透明度；他们还提供了改善对客户的了解和理解的机会。事后方法通常用于解释预贴紧的加固学习模型。基于我们以前对客户支出行为的建模，我们适应了最近的强化学习算法，这些学习算法本质地表征了理想的行为，并且我们过渡到资产管理问题。我们训练固有的可解释的强化学习代理，以提供与原型财务人格特征保持一致的投资建议，这些建议合并为最终建议。我们观察到，受过训练的代理商的建议遵守其预期特征，他们学习复合增长的价值，并且在没有任何明确的参考的情况下，风险的概念以及改善的政策融合。

translated by 谷歌翻译

Predicting Terrorist Attacks in the United States using Localized News Data

Steven J. Krieg , Christian W. Smith , Rusha Chatterjee , Nitesh V. Chawla

分类：机器学习

2022-01-12

每年在美国犯下数十个恐怖袭击，往往会导致死亡和其他重大损害。在更好地理解和减轻这些攻击的结束时，我们展示了一组机器学习模型，用于从本地化的新闻数据中学习，以预测恐怖主义攻击是否将在给定的日历日期和给定状态上发生。最佳模型 - 一种随机森林，了解特征空间的新型可变长度移动平均表示 - 在接收器经营特征下实现的地区分数为$> .667美元，这是由恐怖主义影响最多的五个州的四个国家在2015年和2018年之间。我们的主要发现包括将恐怖主义建模为一系列独立事件，而不是作为一个持续的过程，是一种富有成果的方法 - 尤其是当事件稀疏和异常时。此外，我们的结果突出了对位置之间的差异的本地化模型的需求。从机器学习的角度来看，我们发现随机森林模型在我们的多模式，嘈杂和不平衡数据集上表现出几种深刻的模型，从而展示了我们的新颖特征表示方法在这种情况下的功效。我们还表明，其预测是对攻击之间的时间差距和观察到攻击特征的预测相对稳健。最后，我们分析了限制模型性能的因素，包括嘈杂的特征空间和少量可用数据。这些贡献为利用机器学习在美国及以后的恐怖主义努力中提供了重要的基础。

translated by 谷歌翻译

Explainable AI (XAI): A Systematic Meta-Survey of Current Challenges and Future Opportunities

Waddah Saeed , Christian Omlin

分类：机器学习 | 人工智能

2021-11-11

过去十年已经看到人工智能（AI）的显着进展，这导致了用于解决各种问题的算法。然而，通过增加模型复杂性并采用缺乏透明度的黑匣子AI模型来满足这种成功。为了响应这种需求，已经提出了说明的AI（Xai）以使AI更透明，从而提高关键结构域中的AI。虽然有几个关于Xai主题的Xai主题的评论，但在Xai中发现了挑战和潜在的研究方向，这些挑战和研究方向被分散。因此，本研究为Xai组织的挑战和未来的研究方向提出了系统的挑战和未来研究方向：（1）基于机器学习生命周期的Xai挑战和研究方向，基于机器的挑战和研究方向阶段：设计，开发和部署。我们认为，我们的META调查通过为XAI地区的未来探索指导提供了XAI文学。

translated by 谷歌翻译

DEEMD: Drug Efficacy Estimation against SARS-CoV-2 based on cell Morphology with Deep multiple instance learning

M. Sadegh Saberian , Kathleen P. Moriarty , Andrea D. Olmstead , Christian Hallgrimson , François Jean , Ivan R. Nabi , Maxwell W. Libbrecht , Ghassan Hamarneh

分类：机器学习 | 计算机视觉

2021-05-10

药物重新利用可以加速鉴定有效化合物用于针对SARS-COV-2的临床使用，并具有先前存在的临床安全数据和已建立的供应链的优势。 RNA病毒（例如SARS-COV-2）操纵细胞途径并诱导亚细胞结构的重组以支持其生命周期。可以使用生物成像技术来量化这些形态学的变化。在这项工作中，我们开发了DEEMD：使用深层神经网络模型在多个实例学习框架内的计算管道，以基于对公开可用RXRX19A数据集的形态分析来确定针对SARS-COV-2有效的推定治疗方法。该数据集由SARS-COV-2未感染的细胞和受感染细胞的荧光显微镜图像组成，有或没有药物治疗。 Deemd首先提取歧视性形态学特征，以产生来自未感染和感染细胞的细胞形态特征。然后在统计模型中使用这些形态学特征，以根据与未感染细胞的相似性估算受感染细胞的应用治疗疗效。 DEEMD能够通过弱监督定位受感染的细胞，而无需任何昂贵的像素级注释。 DEEMD确定已知的SARS-COV-2抑制剂，例如Remdesivir和Aloxistatin，支持我们方法的有效性。可以在其他新兴病毒和数据集上探索DEEMD，以便将来快速识别候选抗病毒药治疗}。我们的实施可在线网络https://www.github.com/sadegh-saberian/deemd

translated by 谷歌翻译