机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
从2D观察中恢复关节式3D结构是许多应用中具有挑战性的计算机视觉问题。目前基于学习的方法在公共基准上实现了最先进的性能,但仅限于训练数据集所涵盖的特定类型的对象和动作。基于模型的方法不依赖于培训数据,但在公共基准测试中表现出较低的准确性。在本文中,我们介绍了一种新的基于模型的方法,称为结构运动结构(SfAM)。 SfAM包括一个新的结构术语,它确保整个图像序列中骨骼长度的一致性,并恢复特定结构的场景特定配置。所提出的方法对于嘈杂的2D注释是高度鲁棒的,概括为任意对象和运动类型,并且仅针对训练数据。它实现了最先进的精确度,并在不同的场景中进行了扩展,这在公共基准和真实视频序列的广泛实验中得到了体现。
translated by 谷歌翻译
近年来,车辆重新识别正在吸引越来越多的关注。最具挑战性的问题之一是从其多视点图像中学习车辆的有效表示。现有方法倾向于导出尺寸范围从数千到数万的特征。在这项工作中,我们提出了一个基于深度学习的框架,可以有效地表达车辆。虽然所述特征的维数可以低至256,但是对不同数据集的实验表明,Top-1和Top-5检索精度超过了多种最先进的方法。我们框架的关键是双重的。首先,采用变分特征学习来生成更具辨识性的变分特征。其次,长期短期记忆(LSTM)用于学习车辆的不同视点之间的关系。 LSTM还可以作为编码器来缩小功能。
translated by 谷歌翻译
神经网络的量化在降低计算和存储成本方面具有重要意义。虽然没有领域专家提出特殊的手工优化技术或原始网络架构的特殊操作,但深度量化(低于8位)导致量化模型和全精度计数器部件之间的不可恢复的精度差距,这是诱人的。我们提出了一种新颖的正弦正则化,称为SinReQ,用于低精度深度量化训练。所提出的方法旨在自动地在常规训练期间以预定目标比特宽度产生半量化权重。通过在原始目标函数上添加周期函数(正弦正则化器)来实现所提出的正则化。我们利用具有正弦函数的期望凸度轮廓的固有周期性来自动地在常规训练期间将权重推向目标量化水平。我们的方法通过提供任意比特量化的灵活性和通过同时优化不同的分层正则化器进行定制来结合一致性。在CIFAR10,SVHN上的实验的初步结果表明,训练算法中的积分SumReQ达到2.82%,并且对DoReFa(Zhou)的精确度提高了2.11%。等人,2016)和WRPN(Mishra等人,2018)方法。
translated by 谷歌翻译
科学计算依赖于执行以某些编程语言编码的计算机算法。鉴于特定的可用硬件,算法速度是一个关键因素。有许多科学计算环境用于编码这样的算法。 Matlab是最成功和最广泛的科学计算环境之一,具有丰富的工具箱,库和数据可视化工具。 OpenCV是一个基于(C ++)的库,主要用于计算机视觉及其相关领域。本文提出了一个比较研究,使用20个不同的真实数据集来比较一些机器学习算法的Matlab和OpenCV的速度。虽然Matlab在开发和数据显示方面更加方便,但OpenCV的执行速度更快,在某些情况下速度比达到80以上。通过使用Matlab或类似环境来选择最成功的算法,可以实现两个世界的最佳效果。然后,使用OpenCV或类似环境实现所选算法以获得速度因子。
translated by 谷歌翻译
恶意网络攻击的传播者继续增加其技术的复杂性和复杂性,并且其逃避检测的能力也在不断提高。因此,入侵检测系统也必须发展以满足这些日益具有挑战性的威胁。机器学习用于支持这种必要的改进。但是,训练良好的预测模型可能需要大量标记的训练数据。由于隐私问题阻止了大多数入侵检测机构共享其敏感数据,因此难以获得此类数据集。在本文中,我们建议使用模仿学习,通过私人数据培训的教师模型将入侵检测知识转移到模糊的模型。该学生模型提供了从私有数据中提取的公开共享知识的手段,而不共享数据本身。我们的结果证实,所提出的方案可以产生模仿教师模型的学生入侵检测模型,而无需访问原始数据集。
translated by 谷歌翻译
深度卷积神经网络(CNN)如今在不同的模式识别任务中实现了重要的分析,包括动作识别。当前的CNN越来越深,数据越来越多,这使得它们成为标记训练数据丰富的支路。 CNN还依赖于max / average池,这降低了输出层的维数,从而减弱了它们对标记数据可用性的敏感性。然而,该过程可能稀释上游卷积层的信息,从而影响训练表示的辨别力,尤其是当学习的类别被细粒化时。在本文中,我们引入了一种新颖的分层聚合设计,即最终池,它控制学习表示的粒度,以及动作类别的实际粒度。我们的解决方案基于atree结构的时间金字塔,它在不同级别聚合CNN的输出。此层次结构的最高级别专用于粗略类别,而深度级别更适合细粒度级别。我们的时间锥体的设计基于求解约束最小化问题,其解决方案对应于时空金字塔中不同表示的权重分布。使用具有挑战性的UCF101数据库进行的实验显示了我们的分层设计与其他相关方法的相关性。
translated by 谷歌翻译
对于具有大量无线连接的密集和异构无线网络,最佳资源分配是一项基本挑战。由于优化问题的非凸性质,计算上要求获得最优资源分配。最近,深度强化学习(DRL)已成为解决非凸优化问题的有前途的技术。与深度学习(DL)不同,DRL不需要任何最优/接近最优的训练数据集,该数据集在生成合成数据时不可用或计算成本高。在本文中,我们提出了一种新的基于集中式DRL的多小区系统下行链路功率分配方案,旨在最大化总网络吞吐量。具体而言,我们采用深度Q学习(DQL)方法来实现近似最优功率分配策略。为了对所提出的方法进行基准测试,我们使用遗传算法(GA)来获得接近最优的功率分配解决方案。仿真结果表明,与多小区场景下的传统功率分配方案相比,所提出的基于DRL的功率分配方案表现更好。
translated by 谷歌翻译
随着数字健康革命的出现,每天都会生成,存储和处理大量临床数据。这使得大量医疗保健数据的存储和检索,特别是高分辨率医学图像尤其具有挑战性。因此,医学图像的有效图像压缩在当今的医疗信息系统中起着至关重要的作用,特别是在远程放射学中。在这项工作中,提出了一种基于卷积递归神经网络RNN-Convis的X射线图像压缩方法。所提出的架构可以在部署期间提供可变压缩率,同时它要求每个网络仅针对X射线图像的特定维度进行一次训练。该模型使用多级池化方案,学习上下文特征以进行有效压缩。我们在美国国立卫生研究院(NIH)ChestX-ray8数据集上进行了图像压缩实验,并将所提出的体系结构的性能与最先进的基于RNN的技术和JPEG 2000进行了比较。实验结果描述了改进的压缩性能。根据结构相似性指数(SSIM)和峰值信噪比(PSNR)指标提出的方法。据我们所知,这是第一次使用深度卷积RNN进行医学图像压缩的报告评估。
translated by 谷歌翻译
生活方式不佳是健康风险因素,是导致发病和慢性病的主要原因。个人行为改变可以显着改变不良生活方式的影响。虽然目前医疗保健朝着持久的可改变行为转变,但是,在增加护理人员的工作量和个人持续的护理需求的同时,需要在确保与用户持续互动的同时减轻护理人员的工作。本文描述了CoachAI,aconversational agent辅助健康教练系统的设计和验证,以支持向个人和团体提供健康干预。 CoachAI实例化基于文本的医疗聊天机器人系统,该系统桥接远程人类教练和用户。这项研究为预防性保健和健康生活方式的推广提供了三个主要贡献:(1)它提供了帮助照顾者的对话; (2)旨在通过处理(自动化)重复的护理工作来减少护理人员的工作量,增强对用户的关注; (3)它提供了一个独立于域的移动健康会话,用于健康干预交付。我们将讨论我们的方法,并分析一项为期一个月的体力活动,健康饮食和压力管理验证研究的结果。
translated by 谷歌翻译