智能论文笔记

Energy Trees: Regression and Classification With Structured and Mixed-Type Covariates

Riccardo Giubilei , Tullia Padellini , Pierpaolo Brutti

分类： (统计)机器学习

2022-07-10

数据复杂性的持续增长需要充分解释非平凡结构的方法和模型，因为任何简化都可能导致信息丢失。已经引入了许多分析工具以使用其原始形式的复杂数据对象，但是这种工具通常只能处理单类变量。在这项工作中，我们建议能量树作为回归和分类任务的模型，其中协变量可能是结构化和不同类型的模型。能量树结合了能量统计来概括条件树，它们从中继承了统计上可靠的基础，可解释性，规模不变性和缺乏分配假设。我们将重点放在函数和图形上，作为结构化的协变量，并展示了如何轻松适应几乎所有其他类型的变量。通过一项广泛的仿真研究，我们从可变选择和鲁棒性过度拟合的角度强调了提案的良好表现。最后，我们通过使用人类生物学数据的两个经验分析来验证模型的预测能力。

translated by 谷歌翻译