我们的艺术家和机器学习研究团队设计了一种创造性算法,可以生成真正的雕塑艺术品。这些艺术品不会模仿任何给定的形式,也不能轻易归类为数据集类别。我们的方法将DeepDream从图像扩展到3D点云。提出的算法,Amalgamated DeepDream(ADD),利用点云的属性来创建比天真扩展更好的对象.ADD为机器的创造力提供了希望,推动艺术家探索新方法或材料的创造力,并创造新的类型而不是在onegenre中创建现有表单或样式的变体。例如,从现实主义到抽象表现主义,或极简主义。最后,我们展示了基于ADD创建的点云进行3D打印的雕塑。
translated by 谷歌翻译
车辆重新识别是一个重要的问题,随着视频监控和智能传输应用的快速扩展而变得可取。通过回顾人类视觉的识别过程,我们发现当人类识别不同的车辆时存在本地的等级依赖性。具体地,人类总是首先确定一个车辆的粗粒度类别,即汽车模型/类型。然后,在预测的汽车模型/类型的分支下,他们将通过细微的视觉线索(例如,定制的绘画和挡风玻璃)在细粒度水平上识别特定的车辆。受粗到细分层过程的启发,我们提出了一种用于车辆重新识别的端到端基于RNN的分层注意(RNN-HA)分类模型。 RNN-HA由三个相互耦合的模块组成:第一个模块生成车辆图像的图像表示,第二个层次模块模拟上述层级依赖关系,最后一个注意模块侧重于捕获特定车辆彼此之间的细微视觉信息识别。通过对两个车辆重新识别基准数据集VeRi和VehicleID进行全面的实验,我们证明了所提出的模型实现了超越现有技术的卓越性能。
translated by 谷歌翻译
我们提出了MedSim,一种基于Publicwell建立的生物医学知识图(KGs)和大规模语料库的新型语义相似性方法,研究抗生素的治疗替代。除了KGs的层次结构和语料库外,MedSim还通过构建多维医学特定的特征向量来进一步解释医学特征。采用医生评分的528种抗生素对数据集进行评价,MedSim与其他语义相似性方法相比具有统计学上的显着改善。此外,还提出了MedSim在药物替代和药物滥用预防方面的一些有希望的应用。
translated by 谷歌翻译
近十年来,随着深度卷积神经网络(CNN)的发展,许多最先进的图像分类和音频分类算法取得了显着的成功。但是,大多数工作只利用单一类型的训练数据。在本文中,我们通过利用CNN对视觉(图像)和音频(声音)数据的组合来对鸟类进行分类的研究,该CNN已被稀疏地处理。具体而言,我们提出了基于CNN的融合策略(早期,中期,晚期)类型的多模态学习模型,以解决组合训练数据跨域的问题。我们提出的方法的优点在于我们可以利用CNN不仅从图像和音频数据(频谱图)中提取特征,而且还可以跨特征模式组合特征。在实验中,我们在综合CUB-200-2011标准数据集上训练和评估网络结构,结合我们最初收集的关于数据种类的音频数据集。我们观察到,利用两种数据的组合的模型优于仅用任何类型的数据训练的模型。我们还表明,转移学习可以显着提高分类性能。
translated by 谷歌翻译
MixUp是一种通过混合随机样本的数据增强方法,已经显示出能够显着提高当前深度神经网络技术的预测准确性。然而,MixUp的力量大多是凭经验建立的,其工作和有效性在任何深度都没有解释。在本文中,我们对MixUp进行了理论上的理解,将其作为流形外正则化的一种形式,它将输入空间上的模型限制在数据流形之外。这项分析研究还使我们能够识别由流形侵入引起的MixUp限制,合成样本与歧管的实际例子相撞。这种侵入行为导致过度正规化,从而不合适。为了解决这个问题,我们进一步提出了一种新颖的正则化器,其中混合策略从数据中自适应地学习,并且包含多种入侵损失以避免与数据流形的冲突。我们使用几个基准数据集凭经验证明了我们的正则化器在超深度分类模型和MixUp的过度避免和精度改进方面的有效性。
translated by 谷歌翻译
通过主动选择小批量,可以提高随机梯度下降(SGD)的收敛速度。我们探索了在同一小批量中不太可能选择类似数据点的抽样方案。特别是,我们证明这种排斥采样方案降低了梯度测量仪的方差。这概括了最近关于将小批量多样化(Zhang et al。,2017)的决定点过程(DPP)用于更广泛的排斥点过程的工作。我们首先表明,通过多样化抽样的方差减少现象特别推广到非平稳点过程。然后,我们表明其他点过程在计算上可能比DPP更有效。特别是,我们提出并研究了泊松盘采样---计算机图形社交中经常遇到的---用于此任务。我们凭经验证明,我们的方法在收敛速度和最终模型性能方面都提高了标准SGD。
translated by 谷歌翻译
数据驱动的抓取方法最近取得了显着进展。但这些方法通常需要很多训练数据。为了提高掌握数据采集的效率,本文提出了一种新的把握训练系统,包括从数据采集到模型推理的整个管道。该系统可以通过对映抓取规则辅助​​的纠正策略收集有效的抓取样本,并设计了一个可供性解释器网络,预测像素化抓取可供性图。我们将可读性,不可用性和背景定义为掌握可供性。我们系统的关键优势在于,在对映规则下仅用少量抓取样本训练的像素级示能解释器网络可以在完全看不见的物体和背景上实现显着的性能。仅在模拟中收集训练样本。广泛的定性和定量实验证明了我们提出的方法的准确性和稳健性。在现实世界的实验中,我们在一组家庭用品上获得了93%的成功率,在一组对抗项目上获得了91%的成功率,仅有约6,300个模拟样本。我们在杂乱场景中也达到了87%的准确率。尽管该模型仅使用RGB图像进行训练,但在更改背景纹理时,它也可以执行并且可以在对抗物体组上实现甚至94%的准确度,其优于当前最先进的方法。
translated by 谷歌翻译
我们如何有效地减轻梯度通信分布式优化的开销?这个问题是培训可扩展机器学习模型的核心,并且主要在无约束设置中进行研究。在本文中,我们提出量化Frank-Wolfe(QFW),这是第一个大规模解决约束优化问题的无投影和通信效率算法。我们考虑凸和非凸目标函数,表示为有限和或更一般的随机优化问题,并为QFW的收敛速度提供强有力的理论保证。这是通过提出量化方案来完成的,该方法可以有效地压缩梯度,同时控制在该过程中引入的方差。最后,我们根据通信和针对自然基线的返回解决方案的质量,从经验上验证了QFW的效率。
translated by 谷歌翻译
随着近来深度学习技术的计算能力的提高,图像着色实现了越来越逼真的结果。用人眼识别假彩色图像变得更加困难。在这项工作中,我们提出了一种基于卷积神经网络(CNN)区分自然图像(NI)和彩色图像(CI)的新型取证方法。我们的方法能够实现高分类精度并应对盲检测的挑战场景,也就是说,在测试阶段我们可能遇到的“未知”着色算法没有可用的训练样本。这种盲检性能可视为泛化性能。首先,我们设计并实现了一个基础网络,与最先进的方法相比,它可以在分类准确性和泛化(在大多数情况下)方面获得更好的性能。此外,我们设计了一个新分支,分析了提取特征的较小区域,并将其插入到上述基础网络中。因此,我们的网络不仅可以提高分类的准确性,而且可以在绝大多数情况下加强泛化。为了进一步提高盲检测的性能,我们建议通过成对的自然和彩色图像的线性插值自动构建负样本。然后,我们逐步将这些负样本插入原始训练数据集并继续训练网络。实验结果表明,在针对不同的最先进的着色算法进行测试时,我们的方法可以实现稳定和高泛化性能。
translated by 谷歌翻译
我们考虑具有低销售额的在线产品的基于上下文的动态定价问题。来自全球主要在线零售商阿里巴巴的销售数据显示了低价产品的流行。对于这些产品,由于数据样本不足,存在单个产品动态定价算法不能很好地工作。为了应对这一挑战,我们提出了定价政策,这些政策会同时对产品进行集群并在运行中设定单独的定价决策。通过聚类数据和识别具有相似需求模式的产品,我们利用同一集群内产品的销售数据来改进需求估算并允许更好的定价决策。我们使用遗憾来评估算法,结果表明,当产品需求函数来自多个集群时,我们的算法显着优于传统的单一产品定价策略。使用阿里巴巴的真实数据集进行的数值实验表明,与几项基准政策相比,拟议的政策可以增加收入。结果表明,在线集群是解决与低价产品相关的动态定价问题的有效方法。我们的算法在阿里巴巴的实地研究中进一步实施,连续30天实现了40种产品,并与使用阿里巴巴的常规定价政策的产品进行了比较。实地试验结果表明,总收入增长了10.14%。
translated by 谷歌翻译