智能论文笔记

学习算法的目标之一是补充和减轻人类决策者的负担。算法可以自行预测的专家延期设置，也可以将决定推迟到下游专家有助于实现这一目标。这种环境的一个基本方面是需要学习改善人类弱点的互补预测因子，而不是学习预测因素以优化平均错误。在这项工作中，我们提供了对专家延期中学习补充预测指标的好处的第一个理论分析。为了有效地学习此类预测因素，我们考虑了一个始终如一的替代损失功能的家族，以延期专家并分析其理论特性。最后，我们设计的主动学习方案需要最少的人类专家预测数据，以学习准确的延期系统。

translated by 谷歌翻译

Hermite Polynomial Features for Private Data Generation

Margarita Vinaroz , Mohammad-Amin Charusaie , Frederik Harder , Kamil Adamczewski , Mijung Park

分类：机器学习 | (统计)机器学习

2021-06-09

内核平均嵌入是表示和比较概率度量的有用工具。尽管具有有用性，但内核的意思是考虑无限维度的特征，在差异私有数据生成的背景下，这是具有挑战性的。最近的一项工作建议使用有限维的随机特征近似数据分布的内核平均值嵌入，从而产生可分析的敏感性。但是，所需的随机特征的数量过高，通常是一千到十万，这会使隐私准确的权衡加剧。为了改善权衡取舍，我们建议用Hermite多项式特征替换随机功能。与随机特征不同，储能多项式特征是排序的，其中低订单的特征包含的分布更多的信息比高订单处的分布更多。因此，与明显更高的随机特征相比，HERMITE多项式特征的相对较低的阶多项式特征可以更准确地近似数据分布的平均嵌入。正如在几个表格和图像数据集中所证明的那样，Hermite多项式特征似乎比随机傅立叶功能更适合私人数据生成。

translated by 谷歌翻译