机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
在本文中,共同解决了用户卸载和资源优化的问题,以支持HetNets中的超可靠和低延迟通信(URLLC)。特别地,考虑具有单个宏基站(MBS)和多个重叠小小区基站(SBS)的多层网络,其包括具有不同等待时间和可靠性约束的用户。使用概率保证对用户的延迟和可靠性约束进行建模,URLLC设置中的用户卸载和资源分配(JUR)的联合问题被公式化为优化问题,从而最小化为MBS服务用户的成本。在所考虑的方案中,SBSsbid以给定价格在其覆盖范围内为URLLC用户提供服务,并且MBS决定是在本地为每个用户提供服务还是将其卸载到其中一个覆盖的SBS上。由于JUR优化是NP难的,我们提出了一种低复杂度的基于学习的启发式方法(LHM),其包括基于支持向量机的用户关联模型和凸资源优化(CRO)算法。为了进一步减少延迟,我们提出了一种基于乘法器(ADMM)的交叉方向解决方案来解决CRO问题。仿真结果表明,使用LHM,MBS显着降低了用户的频谱访问延迟($ \ sim $ 93 \%)与JUR相比,与服务用户相比,它的带宽和电力成本(按$ \ sim $ 33 \%)还可以直接服务用户而不需要卸载。
translated by 谷歌翻译
购物环境中的活动识别是一项重要且具有挑战性的计算机视觉任务。我们引入了一个框架,用于整合人体姿势和对象运动,以时间上的方式检测和分类活动(非常短的和类似的活动)。我们通过提出一种多流递归卷积神经网络架构来实现这一目标,该架构由时空\ emph {注意}机制引导,用于活动识别和检测。为此,在没有准确的姿势监视的情况下,我们将生成对抗网络(GAN)纳入生成候选身体关节。此外,基于直觉,复杂的行为要求人类精确识别不止一个信息源,我们将对象运动的第二个流整合到我们的网络中,作为先验知识,我们定量地显示结果的改进。此外,我们通过在MERL购物数据集上实现最先进的结果,凭经验展示了我们的方法的能力。最后,我们进一步研究了这种方法对我们收集的新购物数据集的有效性,以解决现有的缺点,包括但不限于缺乏培训数据。
translated by 谷歌翻译
在本报告中,我们回顾了基于记忆的元学习作为建筑样本有效策略的工具,该策略从过去的经验中学习以适应目标类中的任何任务。我们的目标是为读者提供此工具的概念基础,以构建在陆域上运行的新的可扩展代理。为此,我们提出了基本的算法模板,用于建立最佳预测器和强化学习器,其行为就好像它们具有允许它们有效地利用任务结构的概率模型。此外,我们在贝叶斯框架内重建基于内存的元学习,显示元学习策略接近最优,因为它们分摊贝叶斯过滤数据,其中适应在内存动态中实现为具有足够统计数据的状态机。从本质上讲,基于记忆的学习 - 学习将概率序贯推理的难题转化为回归问题。
translated by 谷歌翻译
我们为室内场景提出了深度逆渲染框架。从任意室内场景的单个RGB图像,我们创建完整的场景重建,估计形状,空间变化的光照,以及空间变化的非朗伯表面反射。为了训练这个网络,我们使用真实世界的材料和渲染来增加SUNCG室内场景数据集,使用快速,高质量,基于物理的GPU渲染器来创建大规模,逼真的室内数据集。我们的逆渲染网络包含物理洞察力 - 包括空间变化的球形高斯光照表示,可模拟渲染层到模型外观,级联结构迭代地改进预测和双边求解器以进行细化 - 允许我们共同推理形状,光照,和反射。实验表明,我们的框架优于以前的方法来估计单个场景组件,这也为各种增强现实提供了各种新颖的应用,例如照片级真实对象插入和材质编辑。代码和数据将公开发布。
translated by 谷歌翻译
基因交互图旨在捕获基因之间的各种关系,并可用于创建更多生物学直观的机器学习模型。有许多这样的图表可以在基因和边缘的数量上有所不同。在这项工作中,我们试图通过将这些图用于“单基因推理”(SGI)来评估这些图所提供的偏差,我们认为这些偏差是更相关的预测任务的代理。 SGI任务评估基因的特定图谱中的邻居可以“解释”基因本身与使用数据集中所有基因的基线相比的程度。我们评估了不同研究组在两个不同数据集TCGA和GTEx上创建的七个主要基因相互作用图。我们发现,对于大多数具有明显较小特征集的基因,一些图表的表现与无偏差基线相当。
translated by 谷歌翻译
本文提出了一种以异步方式有效地执行分布式学习任务的方案,同时最小化具有异构计算和通信能力的无线边缘节点上的梯度过时。本文考虑的设计方法确保所有设备在一定时间内工作,覆盖数据时间/模型分布,学习迭代,模型收集和全局聚合。由此产生的问题是具有二次等式约束的整数非凸程序以及线性相等和不等式约束。因为问题是NP难的,我们放松整数约束,以便有效地解决它的解决方案。利用KKT条件和拉格朗日分析结合建议和改进方法推导出解析界。结果表明,我们的方法减少了梯度过时,并且比同步方案和具有相等任务分配的异步方案提供更高的准确性。
translated by 谷歌翻译
这项研究的目的是引入一个全面的步态数据库,包括93名在两个不同时段在两个终点之间行走的人类,并使用两个智能手机记录他们的步态数据,一个连接到右侧,另一个连接在腰部左侧。该数据被收集在内部以供基于深度学习的方法使用,该方法需要足够的时间点。记录包括年龄,性别,吸烟,每日运动时间,身高和体重的元数据。此数据集是公开可用的。
translated by 谷歌翻译
在机器学习中,需要对分类模型进行训练,以便对topredict类标签进行排序。当训练数据包含关于个人的个人信息时,由于隐私保护,收集训练数据变得困难。本地差异隐私是在没有可信数据策展人时衡量个人隐私的定义。个人与不信任的数据聚合器交互,该聚合器在不学习个人数据的情况下获得关于人口的统计信息。为了在不受信任的环境中训练朴素贝叶斯分类器,我们建议使用满足本地差异隐私的方法。个人发送他们的扰动输入,保持特征值和类标签之间的关系。数据聚合估计朴素贝叶斯分类器所需的所有概率。然后,可以基于估计的概率对新实例进行分类。我们为离散和连续数据提出了解决方案。为了在多维数据中消除高噪声并降低通信成本,我们建议利用降维技术,这些技术可以在扰动其输入之前由个人应用。我们的实验结果表明,即使在局部差分隐私下保证个人隐私,Naive Bayes分类器的准确性也得以保持,并且使用降维增强了准确性。
translated by 谷歌翻译
对来自多个人口统计群体的数据进行训练的机器学习模型可以表示可能存在于数据中的表示差异(Hashimoto等,2018):对训练过程贡献较少的群体可能在模型准确性方面遭受更高的损失;这反过来可以降低这些群体中的人口保留率,因为它们对训练过程的离岸模型有贡献,从而加剧了长期的表现差异。在这项研究中,我们试图理解模型准确性与潜在群体之间的相互作用。表示以及它们如何在无限期的顺序决策设置中发展,以及公平机器学习的使用如何在这个过程中发挥作用。使用简单的用户动态(arrivaland离开)模型,我们描述了在决策过程的每个阶段强加的一套公平标准下使用机器学习模型的长期性质,包括常用的统计平价和平等机会公平性。我们表明,在这个特定的到达/离开模型下,这两个标准都导致表示差异加剧加剧,导致群体完全从样本池中减少,而均衡损失的标准则更好。我们的结果突出了这样一个事实,即公平性不能在更大的反馈循环之外定义,在这种反馈循环中,用户采取过多的行动(他们要么接受算法做出的决策,要么用数据来训练算法或两者)将确定未来的观察和决策。
translated by 谷歌翻译