智能论文笔记

Precision Medicine根据患者的特征为患者提供定制的治疗方法，是提高治疗效率的一种有希望的方法。大规模的OMICS数据对于患者表征很有用，但是它们的测量经常会随着时间而变化，从而导致纵向数据。随机森林是用于构建预测模型的最先进的机器学习方法之一，并且可以在精密医学中发挥关键作用。在本文中，我们回顾了标准随机森林方法的扩展，以进行纵向数据分析。扩展方法根据其设计的数据结构进行分类。我们考虑单变量和多变量响应，并根据时间效应是否相关，进一步对重复测量进行分类。还提供了审查扩展程序的可用软件实现信息。最后，我们讨论了我们审查的局限性和一些未来的研究指示。

translated by 谷歌翻译

关于在线信息行为的数据的日益增长的可用性为政治传播研究带来了新的可能性。但是，这些数据的数量和多样性使它们难以分析，并提示需要开发自动化内容方法，这些方法依赖于广泛的自然语言处理技术（例如机器学习或基于神经网络）。在本文中，我们讨论如何使用这些技术来检测不同平台的政治内容。使用三个验证数据集，其中包括来自在线平台的各种政治和非政治文本文档，我们系统地比较了依赖词典，监督机器学习或神经网络的三组检测技术的性能。我们还使用大型检测模型的大集合（n = 66）检查了不同数据预处理模式（例如，驱动和停止词）对这些技术的低成本实现的影响。我们的结果表明，预处理对模型性能的影响有限，与基于神经网络和机器学习模型所获得的嘈杂数据的最佳结果相比，基于嘈杂的数据的基于词典模型的更强性能。

translated by 谷歌翻译

A generative recommender system with GMM prior for cancer drug generation and sensitivity prediction

Krzysztof Koras , Marcin Możejko , Paulina Szymczak , Eike Staub , Ewa Szczurek

分类：机器学习 | 人工智能

2022-06-07

高通量药物筛查测定法的最新出现引发了机器学习方法的密集开发，包括预测癌细胞系对抗癌药物的敏感性的模型，以及用于生成潜在药物候选者的方法。然而，尚未全面探索具有特定特性的化合物产生具有特定特性和同时建模其功效的概念。为了满足这一需求，我们提出了Vadeers，这是一种基于各种自动编码器的药物功效估算推荐系统。化合物的产生是由具有半监视的高斯混合模型（GMM）的新型自动编码器进行的。先验定义了在潜在空间中的聚类，其中簇与特定的药物特性相关联。此外，Vadeers配备了单元线自动编码器和灵敏度预测网络。该模型结合了抗癌药物的微笑弦表示的数据，它们对蛋白激酶的抑制作用，细胞系生物学特征以及细胞系对药物的敏感性的测量。评估的Vadeers变体在真实和预测的药物敏感性估计之间达到了较高的R = 0.87 Pearson相关性。我们以一种方式训练GMM先验，使潜在空间中的簇通过其抑制作用对应于药物的预计聚类。我们表明，学到的潜在表示和新生成的数据点准确地反映了给定的聚类。总而言之，Vadeers提供了一种全面的药物和细胞系特性模型及其之间的关系，以及引导的新型化合物。

translated by 谷歌翻译