智能论文笔记

专家（MOE）的混合是一种流行的统计和机器学习模型，由于其灵活性和效率，多年来一直引起关注。在这项工作中，我们将高斯门控的局部MOE（GLOME）和块对基因协方差局部MOE（Blome）回归模型在异质数据中呈现非线性关系，并在高维预测变量之间具有潜在的隐藏图形结构相互作用。这些模型从计算和理论角度提出了困难的统计估计和模型选择问题。本文致力于研究以混合成分数量，高斯平均专家的复杂性以及协方差矩阵的隐藏块 - 基因结构为特征的Glome或Blome模型集合中的模型选择问题。惩罚最大似然估计框架。特别是，我们建立了以弱甲骨文不平等的形式的非反应风险界限，但前提是罚款的下限。然后，在合成和真实数据集上证明了我们的模型的良好经验行为。

translated by 谷歌翻译

An $l_1$-oracle inequality for the Lasso in high-dimensional mixtures of experts models

TrungTin Nguyen , Hien D Nguyen , Faicel Chamroukhi , Geoffrey J McLachlan

分类：人工智能 | 机器学习 | (统计)机器学习

2020-09-22

专家（MOE）模型的混合物是对数据中的异质性建模的流行框架，由于其灵活性以及可用的统计估计和模型选择工具的丰富性，用于统计和机器学习中的回归和分类问题。这种灵活性来自于允许MOE模型中的混合物重量（或门控函数）与专家（或组件密度）一起取决于解释变量。与经典的有限混合物和回归模型的有限混合物相比，这允许由更复杂的数据生成过程产生的数据建模，该过程的混合参数与协变量无关。从计算的角度来看，当解释变量的数量可能大于样本量时，MOE模型在高维度中的使用是挑战的，尤其是从理论的角度来看，文献是对于统计估计和特征选择问题，仍缺乏处理维度诅咒的结果。我们考虑具有软马克斯门控函数和高斯专家的有限MOE模型，用于在异质数据上进行高维回归，并通过Lasso进行$ L_1 $调查的估计。我们专注于拉索估计属性，而不是其特征选择属性。我们在LASSO函数的正规化参数上提供了一个下限，该参数确保了根据Kullback-Leibler损失，Lasso估算器满足了$ L_1 $ -ORACLE不平等。

translated by 谷歌翻译