智能论文笔记

A Unified Approach to Coreset Learning

Alaa Maalouf , Gilad Eini , Ben Mussay , Dan Feldman , Margarita Osadchy

分类：机器学习

2021-11-04

给定数据集和损失函数的Coreset通常是一个小称定近似于这个损失从一组给定的查询每次查询。 Coresets已经证明是在许多应用中非常有用。然而，coresets建设中存在的问题依赖的方式完成，这可能需要时间来进行设计和证明coreset的正确性特定家庭的查询。这可能会限制coresets在实际应用中使用。此外，小coresets可证明是不存在的诸多问题。为了解决这些限制，我们提出了建设coresets的通用，基于学习的算法。我们的方法提供coreset一个新的定义，这是标准的定义和目标的接近在通过查询原始数据的\ {EMPH平均}损失自然放松。这允许我们使用一个学习模式来计算给定的输入小coreset相对于使用查询的训练集一个给定的损失函数。我们得出了该方法的正式担保。深网和经典的机器学习问题的实验评估表明，我们了解到coresets产量比最坏情况下的理论保证现有算法（可能在实践中过于悲观）相媲美，甚至更好的效果。此外，我们的方法应用于深网络修剪提供了一个完整的深网络的第一coreset，即压缩所有网络一次，而不是由层或类似的分而治之方法层。

translated by 谷歌翻译

Learning Reward Machines: A Study in Partially Observable Reinforcement Learning

Rodrigo Toro Icarte , Ethan Waldie , Toryn Q. Klassen , Richard Valenzano , Margarita P. Castro , Sheila A. McIlraith

分类：机器学习 | 人工智能

2021-12-17

强化学习（RL）是人工智能中的核心问题。这个问题包括定义可以通过与环境交互学习最佳行为的人工代理 - 其中，在代理试图最大化的奖励信号的奖励信号中定义最佳行为。奖励机（RMS）提供了一种基于Automate的基于自动机的表示，该奖励功能使RL代理能够将RL问题分解为可以通过禁止策略学习有效地学习的结构化子问题。在这里，我们表明可以从经验中学习RMS，而不是由用户指定，并且可以使用所产生的问题分解来有效地解决部分可观察的RL问题。我们将学习RMS的任务作为离散优化问题构成，其中目标是找到将问题分解为一组子问题的RM，使得其最佳记忆策略的组合是原始问题的最佳策略。我们展示了这种方法在三个部分可观察的域中的有效性，在那里它显着优于A3C，PPO和宏碁，并讨论其优点，限制和更广泛的潜力。

translated by 谷歌翻译

DP-SEP! Differentially Private Stochastic Expectation Propagation

Margarita Vinaroz , Mijung Park

分类：机器学习 | (统计)机器学习

2021-11-25

我们有兴趣私有化近似后部推理算法，称为期望传播（EP）。 EP通过迭代地改进到局部可能性的近似近似后，并且已知提供比变差推断（VI）的更好的后不确定性。但是，使用EP对于大规模数据集在内存要求方面对挑战施加了挑战，因为它需要维护存储器中的每个局部近似值。为了克服这个问题，提出了随机期望繁殖（SEP），这仅考虑了一个独特的局部因素，捕获每个可能性术语对后后的平均效果，并以类似于EP的方式改进它。在隐私方面，SEP比EP更具易行，因为在一个因素的每个精炼步骤中，其余因子被固定到相同的值，并且不依赖于EP中的其他数据点，这使得敏感性分析成为易敏感性分析。我们在差异私有随机期望繁殖（DP-SEP）下的后验估计中提供了对隐私准确性权衡的理论分析。此外，我们展示了我们的DP-SEP算法在不同水平的保证隐私的后估计的质量方面评估的综合性和现实数据集。

translated by 谷歌翻译

Medical Knowledge-Guided Deep Learning for Imbalanced Medical Image Classification

Long Gao , Chang Liu , Dooman Arefan , Ashok Panigrahy , Margarita L. Zuley , Shandong Wu

分类：计算机视觉

2021-11-20

深度学习模型在各种图像分类任务上取得了显着性能。然而，当数据不平衡时，许多模型在临床或医疗环境中遭受有限的性能。为了解决这一挑战，我们提出了一种医疗知识引导的单级分类方法，可以利用具体域的分类任务知识来提高模型的性能。我们的方法背后的理由是，一些现有的先前医学知识可以纳入数据驱动的深度学习，以促进模型学习。我们设计了一个基于深入的学习的单级分类管道，用于不平衡图像分类，并在三种用例中演示我们如何通过生成额外的中产阶级来利用每个特定分类任务的医学知识来实现更高的分类性能。我们在三种不同的临床图像分类任务中评估我们的方法（共8459张图像），与六种最先进的方法相比，显示出卓越的模型性能。这项工作的所有代码将在接受纸张后公开提供。

translated by 谷歌翻译

BLUE: A 3D Dynamic Bipedal Robot

German Vargas , Margarita Berrio , Jaime Arcos-Legarda

分类：机器人

2021-11-18

这项工作的目的是设计具有在3D环境中的移动性的机电二维机器人。设计的机器人共有六个驱动的自由度（DOF），每条腿都有两条DOF，位于臀部：一个用于绑架/内收，另一个用于大腿屈曲/延伸，以及膝盖的第三个用于胫骨屈曲的第三个DOF /延期。该机器人设计有点脚，以实现动态的欠压行走。机器人中的每个致动器包括DC齿轮电动机，用于定位测量的编码器，柔性接头以形成串联柔性致动器，以及反馈控制器，以确保轨迹跟踪。为了降低机器人的总质量，胫骨使用拓扑优化设计。由3D印刷部件制造所产生的设计，允许获得机器人的原型来验证致动器的选择。初步实验证实了机器人能够维持站立位置，让我们在动态控制和轨迹生成中绘制未来的工作，以进行周期性稳定行走。

translated by 谷歌翻译

Full Characterization of Adaptively Strong Majority Voting in Crowdsourcing

Margarita Boyarskaya , Panos Ipeirotis

分类：人工智能

2021-11-11

众所使用的众多用于众群质量控制的技术是在有权检查项目和投票是否正确地完成工人。为了抵消工人响应中的可能噪声，一个解决方案是将投票征求更多工人，直到两种可能结果的投票数量之间的差异超过预先指定的阈值{\ delta}。我们展示了一种使用吸收马尔可夫链模拟这种{\ delta} -margin投票共识聚合过程的方法。我们为该投票过程的关键属性提供封闭式方程式 - 即，对于结果的质量，完成的预期投票数量，投票数量的差异以及分布的其他时刻。使用这些结果，我们进一步展示了一个可以调整阈值{\ delta}的值，以实现跨越不同精度水平工人的投票过程的质量等效。然后我们使用此结果来为特征的工人组提供效率平衡的支付速率，以不同程度的响应精度。最后，我们使用完全合成数据以及现实生活众包的投票执行一组模拟实验。我们表明我们的理论模型表征了共识汇总过程的结果。

translated by 谷歌翻译

Hermite Polynomial Features for Private Data Generation

Margarita Vinaroz , Mohammad-Amin Charusaie , Frederik Harder , Kamil Adamczewski , Mijung Park

分类：机器学习 | (统计)机器学习

2021-06-09

内核平均嵌入是表示和比较概率度量的有用工具。尽管具有有用性，但内核的意思是考虑无限维度的特征，在差异私有数据生成的背景下，这是具有挑战性的。最近的一项工作建议使用有限维的随机特征近似数据分布的内核平均值嵌入，从而产生可分析的敏感性。但是，所需的随机特征的数量过高，通常是一千到十万，这会使隐私准确的权衡加剧。为了改善权衡取舍，我们建议用Hermite多项式特征替换随机功能。与随机特征不同，储能多项式特征是排序的，其中低订单的特征包含的分布更多的信息比高订单处的分布更多。因此，与明显更高的随机特征相比，HERMITE多项式特征的相对较低的阶多项式特征可以更准确地近似数据分布的平均嵌入。正如在几个表格和图像数据集中所证明的那样，Hermite多项式特征似乎比随机傅立叶功能更适合私人数据生成。

translated by 谷歌翻译