为了解决深度生成模型学习中的挑战(例如,变分自动编码器的瑕疵和训练生成对抗网络的不稳定性,我们提出了一种新的深度生成模型,名为Wasserstein-Wasserstein自动编码器(WWAE)。我们制定了WWAE的最小化目标分布和生成的分布之间的惩罚最佳传输。通过注意到潜在代码Z的先前$ P_Z $和聚合后验$ Q_Z $可以被高斯人很好地捕获,所提出的WWAE利用方形的Wasserstein的封闭形式 - 因此,WWAE不会受到采样负担的影响,并且通过利用重新参数化技巧在计算上是有效的。数值结果在多个基准数据集上进行了评估,包括MNIST,时尚-MNIST和CelebA表明WWAE学习得更好。结构比VAE和生成更好的视觉质量和更高的样本r FID得分超过VAE和GAN。
translated by 谷歌翻译
单图像超分辨率(SISR)作为低级计算机视觉任务非常重要。基于生成对抗网络(GAN)的深度学习架构的快速发展实现了高效且有效的ISR,以提高数字相机捕获的自然图像的空间分辨率。然而,医学图像的SISR仍然是一个非常具有挑战性的问题。这是由于(1)与自然图像相比,一般来说,医学图像具有较低的信噪比。(2)在自然图像上预训练的基于GAN的模型可能在医学图像中合成不切实际的模式,这可能影响临床解释和诊断,以及(3)香草GANarchitecture可能会受到不稳定训练和崩溃模式的影响,这也会影响SISR结果。在本文中,我们提出了一种新的病灶聚焦SR(LFSR)方法,该方法结合GAN以实现脑肿瘤MRI图像的感知真实SISR结果。更重要的是,我们使用最近开发的GAN变体进行测试和比较,例如,Wasserstein GAN(WGAN)和WGAN with Gradient Penalty(WGAN-GP),并提出一种新的多尺度GAN(MS-GAN),以实现更稳定的高效的训练和提高超分辨率结果的感知质量。基于定量评估和我们设计的平均意见得分,提出的与MS-GAN耦合的LFSR在感知质量和效率方面表现更好。
translated by 谷歌翻译
cycleGAN正在成为医学图像合成中一种有影响力的方法。然而,由于输入和合成图像之间缺乏直接约束,cycleGAN不能保证这两种图像之间的结构一致性,这种一致性在医学成像中至关重要。为了解决这个问题,我们提出了一种结构约束的循环GAN,用于脑MR-to-CT合成,使用不成对数据定义基于模态独立邻域描述符的额外结构 - 一致性损失,以约束结构一致性。此外,我们使用基于位置的选择策略来选择训练图像而不是完全随机的选择方案。从脑MR图像合成CT图像的实验结果表明,我们的方法优于传统的循环GAN,并且使用配对数据训练循环GAN。
translated by 谷歌翻译
背景:药代动力学评价是药物发现和开发的关键过程之一。然而,目前的吸收,分布,代谢,排泄预测模型仍然具有有限的准确性。目的:本研究旨在构建一个综合的转移学习和多任务学习方法,用于开发定量结构 - 活性关系模型,预测四种人体药代动力学参数。方法:药代动力学数据集包括1104种美国FDA批准的小分子药物。该数据包括四个人体药代动力学参数子集(口服生物利用度,血浆蛋白结合率,稳态分布的表观体积和消除半衰期)。对预先训练的模型进行了超过3000万生物活性数据的训练。建立了综合转移学习和多任务学习方法,以加强模型的推广。结果:药代动力学数据集分为三个部分(60:20:20)进行训练,验证和测试,采用改进的最大不相似算法,代表初始集选择算法和加权距离函数。多任务学习技术增强了模型的可预测性。综合转移学习和多任务学习模型表现出最佳的准确性,因为深度神经网络具有一般的特征提取能力,转移学习和多任务学习改进了模型的推广。结论:首先介绍了改进数据集分裂算法的综合转移学习和多任务学习方法,以预测药代动力学参数。该方法可以进一步用于药物发现和开发。
translated by 谷歌翻译
我们提出并分析了$(1,\ lambda)$进化算法的自适应版本,其中当前的突变率是个体的一部分,因此也受到突变。对OneMax基准测试函数进行严格的运行时分析,发现当一个简单的局部变异方案导致$ O(n \ lambda / \ log \ lambda + n \ log n)$时的预期优化时间(适应度评估次数)$ \ lambda $至少是$ C \ ln n $ forsome constant $ C> 0 $。对于$ \ lambda \ ge C \ ln n $的所有值,在所有基于$ \ lambda $ -parallelmutation的无偏黑框算法中,此性能是渐近最佳的。我们的结果表明,进化计算中的自适应可以在运行中找到复杂的最优参数设置。同时,证明了Doerr,Gie {\ ss} en,Witt和Yang~(GECCO~2017)提出的相对复杂的突变率自调整方案可以用我们的简单内生方案代替。在技​​术方面,本文为分析动态参数选择中出现的二维漂移过程提供了新的工具,包括非恒定漂移过程中的占据概率。
translated by 谷歌翻译
Quora is one of the most popular community Q&A sites of recent times. However, many question posts on this Q&A site often do not get answered. In this paper, we quantify various linguistic activities that discriminates an answered question from an unanswered one. Our central finding is that the way users use language while writing the question text can be a very effective means to characterize answerability. This characterization helps us to predict early if a question remaining unanswered for a specific time period t will eventually be answered or not and achieve an accuracy of 76.26% (t = 1 month) and 68.33% (t = 3 months). Notably, features representing the language use patterns of the users are most dis-criminative and alone account for an accuracy of 74.18%. We also compare our method with some of the similar works (Dror et al., Yang et al.) achieving a maximum improvement of ∼ 39% in terms of accuracy.
translated by 谷歌翻译
在这项工作中,我们提出了一种基于ResNet的通用方法,用于光学相干断层扫描(OCT)图像中的散斑减少。建议的模型包含3个主要模块:Convolution-BN-ReLU,Branch和Residual模块。在非传统算法中,模型可以从训练数据中学习,而不是手动选择参数,如噪声水平。将这种提出的方​​法应用于OCT图像显示,在最小结构模糊的情况下,斑点噪声降低的信噪比提高了22dB以上。所提出的方法提供了强大的泛化能力,并且可以在不重新训练的情况下处理其他类型的OCT图像。它在抑制散斑噪声和揭示细微特征方面优于其他滤波方法。
translated by 谷歌翻译
使用交通摄像头作为传感器的城市交通优化正在推动最先进的多目标多摄像机(MTMC)跟踪。这项工作介绍了CityFlow,一个城市规模的交通摄像机数据集,包含超过3小时的同步40个摄像头的10个交叉点的高清视频,两个同步摄像头之间的最长距离为2.5公里。据我们所知,CityFlow是空间覆盖范围内最大规模的数据集内容,以及城市环境中的摄像机/视频数量。该数据集包含超过200K个带注释的边界框,可以覆盖各种场景,视角,车辆模型和urbantraffic流动条件。提供相机几何和校准信息以帮助进行时空分析。此外,该基准的子集可用于基于图像的车辆识别(ReID)的任务。我们对MT2跟踪,多目标单摄像机(MTSC)跟踪,对象检测以及基于图像的ReID在此数据集上进行了基线/最先进方法的广泛实验评估,分析了不同网络架构的影响,损失函数,时空模型及其在任务有效性方面的组合。评估服务器在2019AI城市挑战赛(https://www.aicitychallenge.org/)上发布我们的基准测试,允许研究人员对他们最新技术的表现进行比较。我们希望这个数据集可以催化该领域的研究,推动最先进的技术发展,并在现实世界中实现部署的流量优化。
translated by 谷歌翻译
最近,基于深度学习的三维人脸重建方法已经显示出质量和效率的最终结果。然而,训练深度神经网络通常需要大量数据,而具有地面真实3D面部形状的人脸图像是稀缺的。在本文中,我们提出了一种新颖的深三维人脸重建方法,1)利用鲁棒的混合损失函数进行弱监督学习,同时考虑到监督的低水平感知水平信息,以及2)通过以下方式进行多图像重建:利用差异形式的补充信息进行形状聚合。我们的方法快速,准确,稳健,具有较大的姿势。我们提供全面的三维实验,系统地将我们的方法与十五种最新方法进行比较,并展示其最先进的性能。
translated by 谷歌翻译
预测气味的愉悦性简化了气味的评估,并且具有应用于香水和环境监测行业的潜力。用于预测气味愉悦性的经典算法通常使用手动特征提取器和独立分类器。手动设计良好的特征提取器取决于专家知识和经验是算法准确性的关键。为了克服这个困难,我们提出了一种通过卷积神经网络预测气味愉悦的模型。在我们的模型中,卷积神经层取代了手动特征提取器并显示出更好的性能。实验表明,我们的模型与人类之间的相关性在愉悦程度上超过90%。 Andour模型在区分绝对令人愉快或令人不快的气味方面具有99.9%的准确度。
translated by 谷歌翻译