专家(MOE)的混合是一种流行的统计和机器学习模型,由于其灵活性和效率,多年来一直引起关注。在这项工作中,我们将高斯门控的局部MOE(GLOME)和块对基因协方差局部MOE(Blome)回归模型在异质数据中呈现非线性关系,并在高维预测变量之间具有潜在的隐藏图形结构相互作用。这些模型从计算和理论角度提出了困难的统计估计和模型选择问题。本文致力于研究以混合成分数量,高斯平均专家的复杂性以及协方差矩阵的隐藏块 - 基因结构为特征的Glome或Blome模型集合中的模型选择问题。惩罚最大似然估计框架。特别是,我们建立了以弱甲骨文不平等的形式的非反应风险界限,但前提是罚款的下限。然后,在合成和真实数据集上证明了我们的模型的良好经验行为。
translated by 谷歌翻译
专家(MOE)模型的混合物是对数据中的异质性建模的流行框架,由于其灵活性以及可用的统计估计和模型选择工具的丰富性,用于统计和机器学习中的回归和分类问题。这种灵活性来自于允许MOE模型中的混合物重量(或门控函数)与专家(或组件密度)一起取决于解释变量。与经典的有限混合物和回归模型的有限混合物相比,这允许由更复杂的数据生成过程产生的数据建模,该过程的混合参数与协变量无关。从计算的角度来看,当解释变量的数量可能大于样本量时,MOE模型在高维度中的使用是挑战的,尤其是从理论的角度来看,文献是对于统计估计和特征选择问题,仍缺乏处理维度诅咒的结果。我们考虑具有软马克斯门控函数和高斯专家的有限MOE模型,用于在异质数据上进行高维回归,并通过Lasso进行$ L_1 $调查的估计。我们专注于拉索估计属性,而不是其特征选择属性。我们在LASSO函数的正规化参数上提供了一个下限,该参数确保了根据Kullback-Leibler损失,Lasso估算器满足了$ L_1 $ -ORACLE不平等。
translated by 谷歌翻译