根据有关批准药物的信息预测药物的新作用可以被视为推荐系统。矩阵分解是最常用的推荐系统之一,为其设计了各种算法。用于预测药物效应的现有算法的文献调查和摘要表明,大多数此类方法,包括邻里正规逻辑矩阵分解,这是基准测试中最佳性能的最佳性能,它使用了仅考虑存在或不存在相互作用的二进制矩阵。但是,已知药物作用具有两个相反的方面,例如副作用和治疗作用。在本研究中,我们建议使用邻域正规化双向基质分解(NRBDMF)通过纳入双向性来预测药物作用,这是药物效应的特征。我们使用这种建议的方法使用矩阵来预测副作用,该基质考虑了药物效应的双向,其中已知的副作用被分配为阳性标签(加1),并为已知的治疗效应分配了阴性(负1)标签。使用药物双向信息的NRBDMF模型在预测列表的底部达到了副作用的富集和指示。第一次尝试使用NRBDMF来考虑药物效应的双向性质的尝试表明,它降低了假阳性并产生了高度可解释的输出。
translated by 谷歌翻译
不良事件是药物开发中的一个严重问题,并且已经开发了许多使用机器学习的预测方法。随机的拆分交叉验证是机器学习中模型构建和评估的事实上的标准,但是在不利事件预测中应注意,因为这种方法与现实世界的情况不符。使用时轴的时间拆分被认为适用于现实世界预测。但是,由于缺乏可比的研究,使用时间和随机分裂获得的模型性能差异尚不清楚。为了了解差异,我们使用九种类型的复合信息作为输入,八个不良事件作为目标和六种机器学习算法比较了时间和随机分裂之间的模型性能。在曲线值下,随机分裂显示的面积比八个目标中的六个时间分配比分裂更高。训练和测试数据集的化学空间相似,这表明适用性域的概念不足以解释从分裂中得出的差异。对于蛋白质相互作用,曲线差异下的面积比其他数据集更小。随后的详细分析表明,在时间分配时间内使用基于知识的信息的危险。这些发现表明,在不利事件预测中了解时间和随机分裂之间的差异的重要性,并强烈表明适当使用分裂策略和结果的解释对于不利事件的现实预测是必要的。我们提供本研究中使用的分析代码和数据集(https://github.com/mizuno-group/ae_prediction)。
translated by 谷歌翻译