光学相干断层扫描(OCT)是一种非侵入性成像模式,其广泛用于临床眼科学。 OCT图像能够可视化深层视网膜层,这对于视网膜病变的早期诊断至关重要。在本文中,我们描述了一个全面的开放存取数据库,包含500多个分类为不同病理状况的高分辨率图像。图像类别包括正常(NO),黄斑裂孔(MH),年龄相关性黄斑变性(AMD),中央浆液性视网膜病变和糖尿病性视网膜病变(DR)。这些图像是从光栅扫描协议获得的,扫描长度为2mm,分辨率为512×1024像素。我们还包括25个正常OCT图像及其相应的地面实况描绘,可用于准确评估OCT图像分割。
translated by 谷歌翻译
机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
我们研究后勤强盗,其中奖励是二元成功概率$ \ exp(\ beta a ^ \ top \ theta)/(1 + \ exp(\ beta a ^ \ top \ theta))$ andactions $ a $和systems $ \ theta $在$ d $ -dimensional单位球内。虽然先前后悔限制了解决斜率参数$ \ beta $的logistic banditexhibit指数依赖的算法,但我们建立了与Thompson采样无关的格式。 beta $。特别是,我们确定,当可行动作的集合与可能的系数向量集合相同时,Thompsonsampling的贝叶斯遗憾是$ \ tilde {O}(d \ sqrt {T})$。我们还建立了一个$ \ tilde {O}(\ sqrt {d \ etaT} / \ lambda)$ bound,它适用范围更广,其中$ \ lambda $是最差情况下的最佳对数,$ \ eta $是“脆弱性维度,“一个新的统计数据,用于捕捉一个模型的最优行动对其他模型的满足程度。我们通过证明,对于任何$ \ epsilon> 0 $,没有算法可以实现$ \ mathrm {poly}(d,1 / \ lambda)\ cdot T ^ {1- \ epsilon} $,我们证明了脆弱性维度起着非常重要的作用。后悔。
translated by 谷歌翻译
这项工作提供了一个文本挖掘背景及其用于深入分析政治家提供的信息的用途。具体来说,我们处理一系列专家系统探索美国总统大量演讲的修辞动态,范围从华盛顿到特朗普。特别是,演讲被视为复杂的专家系统,其结构可以通过等级规则法有效地分析。论文的方法论贡献是双重的。首先,我们使用MillerCenter网站上的网络抓取程序(收集演讲的存储库)开发基于文本挖掘的程序来构建数据集。其次,我们通过对各个演讲实施等级大小的程序来探索话语数据的隐含结构,即每个语音在其频率方面的排名。提出的文本挖掘和等级大小方法的组合的科学意义可以在其灵活性和通用性中找到,这使得它可以重现于广泛的专家系统和文本挖掘环境。研究结果本身证明了所提出的方法的有用性和后续的分析。事实上,就影响而言,值得注意的是,从1789年4月30日到45年美国总统的45位美国总统的社会,政治和语言性质的有趣结论。 2017年2月28日发布的政治信息可以消除。事实上,拟议的分析显示了一些显着的规律,不仅在特定的演讲中,而且在不同的演讲中。此外,在纯粹的方法论视角下,所提出的贡献提出了产生语言决策算法的可行方法。
translated by 谷歌翻译
我们通过评估储层动力学的特征值谱来分析循环网络的稳定性,特别是训练期间的储层计算模型。为了避免在用反馈检查闭环油藏系统时出现的不稳定性,我们建议打破闭环系统。基本上,我们在一段时间内展开油藏动力学,同时收集保持系统整体时间完整性的反馈效应。我们分别用最小二乘回归和FORCE训练评估我们的定点和时变目标方法。 Ouranalysis建立特征值谱(即,谱圈训练进展的收缩)作为一个有效的有效度量来衡量训练的收敛性以及水库混沌活动向稳定状态的收敛性。
translated by 谷歌翻译
在这个机器学习模型的时代,它们的功能受到对抗性攻击的威胁。面对使人工神经网络健壮的斗争,寻找能够抵御这些攻击的模型非常重要。在这项工作中,我们首次提出了对更多生物合理网络行为的综合分析,即在最先进的对抗性测试中的呼吸神经网络(SNN)。针对不同类型的单步和多步FGSM(快速梯度标志法)攻击,对白盒和黑盒设置中常规VGAG-9人工神经网络(ANN)和等效尖峰网络与CIFAR-10数据集的精度降低进行了对比研究。 。我们证明,与ANN黑白盒攻击情景相比,SNN往往表现出更强的弹性。另外,我们发现SNN的鲁棒性在很大程度上取决于相应的训练机制。我们观察到,基于尖峰反向传播训练的SNN比在几个白盒和黑盒场景中由ANN到SNN转换规则获得的SNN更具有对抗性。最后,我们还提出了一个简单而有效的框架,用于制作来自SNN的对抗性攻击。我们的研究结果表明,根据我们提出的方法从SNNs中采集的攻击比使用人工神经网络制作的攻击强得多。
translated by 谷歌翻译
近年来,数据在经济中作为一种优势发挥着越来越重要的作用。在许多设置中,数据聚合器无法直接验证他们购买的数据的质量,也无法验证数据源在创建数据时所付出的努力。最近的工作探索了一些机制,以确保数据源与单一数据聚合器共享高质量数据,解决道德风险问题。通常,有一种独特的,社会有效的解决方案。在本文中,我们考虑数据市场中存在多个数据聚合器。由于数据可以在创建后便宜地再现和传输,因此数据源可以与多个聚合器共享相同的数据,从而导致数据聚合器之间的共存。这种耦合可能导致均衡和社会效率低下的非唯一性。我们研究了最近在文献中已经接受过研究的特定类机制,并且我们描述了所得到的数据市场的所有广义纳什均衡。我们表明,与单聚合的情况相比,存在无限多的广义纳什均衡或者没有。我们还为所有均衡提供了必要和充分的条件,使其在社会上效率低下。在分析中,我们确定了这些机制的组成部分,这些组成部分会产生不良后果,表明需要研究与多个数据购买者和销售者进行竞争性设置的机制。
translated by 谷歌翻译
随着人口的增加,社交和文化活动中的人群聚会越来越多。通过计算机视觉和专家决策系统进行监控有助于了解大型聚会中的人群现象。了解人群现象有助于早期识别不需要的事件及其预防。运动流是重要的人群现象之一,可以有助于描述拥抱行为。流可以用于理解crowd中的不稳定性。然而,由于人群移动中的随机性和传感设备的限制,提取运动流是一项具有挑战性的任务。此外,如果随机性很高,诸如光流的低级特征可能会产生误导。在本文中,我们提出了一种基于朗之万方程的新模型来分析密集拥挤场景视频中的线性主导流。我们假设一个具有三个分量的力模型,即外力,约束/漂移力和扰动力。发现这些力足以描述密集人群视频中的线性或近线性运动。与现有的流行人群分割方法相比,该方法明显更快。所提出的模型的评估已经在公开可用的数据集以及我们的数据集上进行。已经观察到,与现有技术相比,所提出的方法能够以更高的准确度估计和分割密集人群中的线性流,并且计算开销显着降低。
translated by 谷歌翻译
图像恢复是一种从噪声观察中重建原始图像的可行估计的技术。在本文中,我们提出了一种基于U-Net的深度神经网络模型,以环境感知的方式恢复月球表面图像上的缺失像素,这通常被称为图像绘制问题。我们利用Kaguya卫星上的多波段成像仪(MI)捕获的月球表面的灰度图像进行实验,结果表明我们的方法可以重建具有良好视觉质量和提高PSNR值的月球表面图像。
translated by 谷歌翻译
图像识别系统在过去的几十年中取得了巨大的进步,部分原因在于我们学习紧凑和强大的图像表示能力。当我们目睹这些系统的广泛采用时,必须考虑从图像表示中意外泄漏信息的问题,这可能会损害数据所有者的隐私。本文研究了学习图像表示的问题,该图像表示最小化了用户信息的这种泄漏。我们将问题表述为一种对抗非零和游戏,找到一个具有两个竞争目标的良好嵌入函数:尽可能多地保留任务依赖的判别图像信息,同时最小化关于用户的其他敏感属性的信息量(通过熵测量) 。我们使用来自非线性系统理论的工具分析所提出的公式的稳定性和收敛动力学,并与相应的对抗性零和游戏公式进行比较,该公式将可能性作为信息内容的度量。 UCI,Extended Yale B,CIFAR-10和CIFAR-100数据集的数值实验表明,我们提出的方法能够学习具有高任务性能的图像表示,同时减少预定义敏感信息的泄漏。
translated by 谷歌翻译