通过将机器学习算法应用于“大数据”,可以在manydomains中看到图像处理能力的快速发展。然而,在医学图像分析领域,由于大规模,注释良好的数据集的可用性有限,部分进展受到限制。造成这种情况的主要原因之一是与生产大量高质量元数据相关的高成本。最近,人们越来越关注为此目的应用众包;这种技术已经被证明可以有效地创建从计算机视觉到物理学的各个学科的大规模数据集。尽管这种方法越来越受欢迎,但还没有全面的文献综述为研究人员提供指导,以考虑在他们自己的医学成像分析中使用众包方法。在本次调查中,我们回顾了将众包应用于2018年7月之前发布的医学图像分析的研究。我们确定了常见的方法,挑战和考虑因素,为采用这种方法的研究人员提供了实用指南。最后,我们将讨论这一新兴领域的未来发展机遇。
translated by 谷歌翻译
我们专注于从输入RGB视频数据估计人手震颤频率的问题。估计视频中的震颤对于非侵入性监测,分析和诊断患有运动障碍(例如帕金森病)的患者非常重要。我们考虑手抖动估计的两种方法:(a)拉格朗日方法,我们在视频中检测手的每一帧,并估计沿着轨迹的震颤频率; (b)欧拉方法,我们首先定位手,随后沿着手的运动轨迹移除大运动,并且我们使用随时间编码的视频信息作为强度值或相位信息来估计震颤频率。我们估计新的人类震颤数据集TIM-Tremor上的手抖动,其中包含静态任务以及涉及手的较大运动的多个更动态的任务。该数据集具有55个震颤患者,共同记录:来自受影响的手的相关地面实况加速度计数据,RGB视频数据和对准的深度数据。
translated by 谷歌翻译
在监督学习任务中很好地推广依赖于正确地将训练数据扩展到输入空间的大区域。实现此目的的一种方式是将预测约束为已知不相关的输入上的不变的变换(例如,翻译)。通常,这是通过数据增强来完成的,其中通过将手工制作的变换应用于输入来扩大训练集。我们认为,不变性应该被合并到模型结构中,并使用边际可能性来学习,这正确地奖励了不变模型的复杂性降低。我们用高斯过程模型证明了这一点,因为它们可以很容易地估计它们的边际可能性。我们的主要贡献是高斯过程的变分推理方案,其中包含由采样过程描述的不变性。我们通过反向传播来学习采样过程,以最大化边缘似然。
translated by 谷歌翻译
概率生成模型可用于压缩,去噪,修复,纹理合成,半监督学习,无监督特征学习和其他任务。鉴于这种广泛的应用,这些模型的制定,培训和评估方式存在很多异质性并不令人惊讶。因此,模型之间的直接比较通常很困难。本文回顾了与生成模型的评估和解释相关的大多数已知但经常未被认可的属性,重点是图像模型。特别地,我们显示当前最常用的标准的三个 - 平均对数似然,Parzen窗口估计和样本的视觉保真度 - 在数据高维时在很大程度上彼此独立。因此,关于一个标准的良好性能不一定意味着与其他标准相关的良好性能。我们的结果表明,从一个标准到另一个标准的推断是不合理的,并且生成模型需要直接针对它们预期的应用进行评估。此外,我们提供了证明Parzen窗口估计通常应该被避免的示例。
translated by 谷歌翻译
今天拍摄的绝大多数照片都是通过手机拍摄的。虽然他们的质量正在迅速增长,但由于物理限制和成本限制,手机相机难以与DSLR相机进行质量比较。这激励我们计算增强这些图像。我们对Ignatov等人的研究结果进行了扩展,他们能够将紧凑型移动摄像机的图像转换为质量与DSLR相机拍摄的高分辨率照片相当的图像。然而,所采用的神经模型需要大量的计算资源,并且不足以在移动设备上运行。我们在之前的工作基础上,探索不同的网络架构,旨在提高图像质量和速度。凭借高效的网络架构,它以低空间分辨率完成大部分处理,我们获得了比基线高得多的平均意见得分(MOS),同时在消费级CPU上将计算速度提高了6.3倍。这表明使用未来的手机硬件进行基于神经网络的照片增强的有希望的方向。
translated by 谷歌翻译
信息理论贝叶斯对鲁索和范罗伊的后悔束缚了对先前不确定性的遗憾依赖性。然而,这种依赖性是熵,随着动作数量的增加,它可以变得任意大。我们建立了新的界限,而不是依赖于速率 - 失真的概念。在其他方面,这使我们能够通过信息理论论证恢复近似线性强盗的最佳界限。我们还提供了一个物流强盗的约束,它可以显着提高以前最好的可用性,尽管这个界限取决于我们只能通过计算量化的信息理论统计量。
translated by 谷歌翻译
目的:验证商业上可获得CE认证的深度学习(DL)系统RetCAD v.1.3.0(Thirona,Nijmegen,The Netherlands)的性能,用于联合自动检测糖尿病视网膜病变(DR)和年龄 - 相关性黄斑变性(AMD)在adataset上的彩色眼底(CF)图像中混合存在眼病。方法:在DR-AMD数据集上进行关于DR和AMD的联合检测的评估,其中600个图像在常规临床实践中获得,包含两种疾病的可参考和不可参考的病例。由经验丰富的眼科医生为DR和AMD评估每个图像以建立参考标准(RS),并由四个独立的观察者进行比较以与人类表现进行比较。在Messidor(1200张图像)上进一步评估验证,用于个体鉴定可参考的DR,以及针对相应的RS的年龄相关眼病研究(AREDS)数据集(133821图像)用于可参考的AMD。结果:关于DR-AMD数据集的联合验证,系统在ROC曲线下的面积(AUC)为95.1%,用于检测referableDR(SE = 90.1%,SP = 90.6%)。对于可参考的AMD,AUC为94.9%(SE = 91.8%,SP = 87.5%)。 DR的平均人类表现为SE = 61.5%和SP = 97.8%;对于AMD,SE = 76.5%,SP = 96.1%。关于Messidor中可参考DR的检测,AUC为97.5%(SE = 92.0%,SP = 92.1%);对于AREDS中的可接受的AMD,AUC为92.7%(SE = 85.8%,SP = 86.0%)。结论:经过验证的系统在同时检测DR和AMD方面与人类专家相当。这表明DL系统可以促进眼科疾病的联合筛查,并成为眼科专家的快速和可靠的支持。
translated by 谷歌翻译
详细了解风力涡轮机性能状态分类可以改善风能行业的运营和维护。由于风力涡轮机具有不同的工程特性,用于分类的标准监督学习模型并未对从不同​​风场获得的数据集进行概括。我们提出了两种方法来处理训练模型的可传递性:第一,以功率曲线对齐的形式进行数据归一化,第二,基于卷积神经网络和特征空间扩展的鲁棒方法。我们通过工业应用证明了我们的方法在实际数据集上的成功。
translated by 谷歌翻译
加权模型集成(WMI)将加权模型计数(WMC)扩展到混合离散连续域上的函数集成。它在解决图形模型和概率编程中的推理问题方面具有显着的前景。然而,WMI的最先进工具是有限的性能间隔,忽略了对提高效率至关重要的独立结构。为了解决这个局限性,我们提出了一种有效的模型积分算法,用于具有树原始图的理论。我们通过使用搜索来执行集成来利用稀疏图结构。我们的算法大大提高了这些问题的计算效率,并利用了变量之间的特定于文本的独立性。实验结果表明,与现有的WMI求解器相比,树形依赖性问题的实际加速比较。
translated by 谷歌翻译
人们越来越关注胸部X射线(CXR)的自动分析,作为筛查肺结核易感人群的敏感且廉价的手段。在这项工作中,我们评估了最新版本的CAD4TB,这是一个专为此目的而设计的软件平台。 CAD4TB的第6版于2018年发布,并在此处在5565个CXR图像的独立数据集上进行测试,其中可获得GeneXpert(Xpert)痰测试结果(854名Xpert阳性受试者)。对500名受试者(50%Xpert阳性)的子集进行了审查和注释。 5名专家观察员独立获得放射参考标准。相对于Xpert和放射参考标准,CAD4TB的最新版本在接收器操作曲线(ROC)下的面积方面优于所有先前版本。对于Xpert的改进在高灵敏度水平下是明显的,在90%灵敏度下获得76%的特异性。与放射学参考标准相比,CAD4TB v6在相当大的范围内优于以前的版本,在90%灵敏度下达到98%的特异性。 CAD4TB v6的性能与任何针对Xpert参考标准的专家观察者之间没有发现实质性差异。对该数据集的成本和效率分析表明,在标准临床情况下,以90%的灵敏度运行,CAD4TB v6的用户每天可处理132个受试者,每个屏幕的平均成本为每个主题5.95美元,而版本3的用户仅处理85个主题每天每人只需支付8.41美元。在所有测试的操作点上,版本6显示出比任何其他版本更高效且更具成本效益。
translated by 谷歌翻译