我们的艺术家和机器学习研究团队设计了一种创造性算法,可以生成真正的雕塑艺术品。这些艺术品不会模仿任何给定的形式,也不能轻易归类为数据集类别。我们的方法将DeepDream从图像扩展到3D点云。提出的算法,Amalgamated DeepDream(ADD),利用点云的属性来创建比天真扩展更好的对象.ADD为机器的创造力提供了希望,推动艺术家探索新方法或材料的创造力,并创造新的类型而不是在onegenre中创建现有表单或样式的变体。例如,从现实主义到抽象表现主义,或极简主义。最后,我们展示了基于ADD创建的点云进行3D打印的雕塑。
translated by 谷歌翻译
我们提出了一种新的彩色光度立体(CPS)方法,可以一次性恢复高质量,详细的3D面部几何形状。我们的系统使用三种不同颜色的近点光源和一个摄像头。我们首先利用3D可变形模型(3DMM)和面部部件的语义分割来实现光源的稳健自校准。然后,我们通过将反照率共识,反照率相似性和代理事先纳入统一框架来解决光谱模糊问题。我们避免需要反照率的空间恒定性,并使用基于反照率范数轮廓的反照率相似性的新度量。实验表明,我们的新方法在具有高保真几何形状的单个图像中产生最先进的结果,其中包括皱纹等细节。
translated by 谷歌翻译
预训练的深度学习模型越来越多地被用于提供各种计算密集型预测分析服务,例如fitnesstracking,语音和图像识别。无状态且高度可并行化的深度学习模型使它们非常适合无服务器计算范例。但是,由于动态工作负载和具有部署和管理成本的各种可用资源配置,为这些服务做出有效的资源管理决策是一个难题。为了应对这些挑战,我们提出了一个名为Barista的分布式和可扩展的深度学习预测服务系统,并进行了以下分析。首先,我们通过识别各种趋势,为预测工作量提供快速有效的方法。其次,我们制定了一个优化问题,以最大限度地降低所产生的总成本,同时确保合理准确的有界预测延迟。第三,我们提出了一种有效的启发法来识别合适的计算资源配置。第四,我们提出了一个智能代理,通过水平和垂直缩放来分配和管理计算资源,以保持所需的预测延迟。最后,我们使用代表性的现实工作负载进行城市交通服务,展示并验证了Barista的功能。
translated by 谷歌翻译
分子的几何形状,也称为构象,是分子最重要的特性之一,决定了它参与的反应,它形成的键,以及它与其他分子的相互作用。常规构象产生方法使手工设计的分子力能量函数最小化,所述分子力能量函数与在自然界中观察到的分子的真实能量函数没有很好地相关。它们产生几何形状多样的构象,其中一些构造非常类似于地面真实构象,而其他构象则非常不同。在本文中,我们提出了一个条件深度生成图神经网络,它从数据学中直接学习能量函数,在给定分子图的情况下生成分子构象。在三个大型小分子数据集上,我们证明了我们的方法产生了一组构象,这些构象平均比从常规力场方法获得的那些更容易接近相应的参考构象。我们的方法通过生成彼此不太相似的构象来维持几何多样性,并且在计算上更加快速。我们还表明,我们的方法可用于为常规力场方法提供初始坐标。在一个评估的数据集中,我们表明这种组合允许我们结合两种方法的优点,产生平均接近地面真实构象的生成构象,其中一些非常类似于地面真实构象。
translated by 谷歌翻译
未经授权远程访问来自网络摄像机的流式视频的风险突显了对更强大的隐私保护的需求。为此,我们模拟了一个无镜头编码孔径(CA)相机作为外观编码器,即第一层隐私保护。我们的目标是从编码孔径视频中进行人类动作识别,其编码孔径掩模未知并且不需要重建。我们通过使用基于相位相关和对数极坐标变换的不可逆运动特征来插入第二层隐私保护。相位相关对转换进行编码,而对数极坐标变换对面内旋转和缩放进行编码。 Weshow翻译功能的关键属性是掩码不变的。该属性允许我们通过消除对特定掩模设计的依赖来简化分类器的训练。基于UCF和NTUdatasets子集的结果显示了我们系统的可行性。
translated by 谷歌翻译
今天的机器人系统越来越多地转向计算上昂贵的模型,例如深度神经网络(DNN),用于定位,感知,计划和对象检测等任务。然而,资源受限的机器人,如低功率无人机,通常没有足够的机载计算资源或功率储备来可扩展地运行最准确的,最先进的网络计算模型。云机器人技术允许移动机器人将计算机卸载到集中式服务器,如果它们在本地不确定或想要运行更准确的计算密集型模型。然而,云机器人成为一个关键的,通常低估的成本:与云过度拥塞的无线网络通信可能导致延迟或数据丢失。实际上,通过拥塞网络从多个机器人发送高数据速率视频或LIDAR会导致实时应用程序的延迟过高,我们会通过实验测量。在本文中,我们制定了一个新的机器人卸载问题---机器人如何以及何时卸载传感任务,特别是如果它们不确定,在提高准确性的同时最大限度地降低云通信的成本?我们将卸载制定为机器人的顺序决策问题,并提出使用深度强化学习的解决方案。在使用最先进的视觉DNN的模拟和硬件实验中,我们的卸载策略将视觉任务性能提高了1.3-2.6倍的基准标记卸载策略,使机器人有可能显着超越其板载传感精度,但云通信成本有限。
translated by 谷歌翻译
转型人工智能技术有可能在不久的将来重塑社会的关键方面。但是,为了适当地为这些技术的到来准备政策,需要准确的预测和时间表。在2018年夏季(ICML,IJCAI和HLAI会议)对三个AI会议的与会者进行了一项调查。该调查包括在下一个十年评估AI能力的问题,预测变革AI的五个场景的问题以及关于计算影响的问题。人工智能研究中的资源。受访者表示,人工任务的中位数为21.5%(即人工目前支付的所有任务)现在可以实现自动化,并且这个数字将在5年内上升到40%,在10年内上升到60% 。中位数预测表明,人工智能系统有50%的概率能够在25年内实现90%的当前人工任务自动化,并在50年内实现99%的当前人工任务。发现出席会议对所有预测产生了统计上的显着影响,HLAI的与会者提供了更加乐观的时间表,而且不确定性较低。这些研究结果表明,人工智能专家预计人工智能技术的重大发展将在未来十年内持续到可能对社会产生深远变革影响的程度。
translated by 谷歌翻译
无监督图像转换旨在学习在给定未配对训练数据的情况下从源域到另一个目标域的转换。一些最先进的作品在GANs-basedunsupervised图像到图像翻译中取得了令人瞩目的成果。与纹理更改任务(如样式转换)相比,它无法捕获域之间的强几何或结构变化,或者对于复杂场景不能令人满意。最近,SAGAN(HanZhang,2018)表明,自我关注网络比基于卷积的GAN产生更好的结果。然而,这些注意网络在无监督的图像到图像转换任务中的有效性尚未得到验证。在本文中,我们提出了一种具有自我关注网络的无监督图像到图像的翻译,其中远程依赖性不仅有助于捕获强烈的几何变化,而且还可以使用来自所有特征位置的细节来生成细节。在实验中,我们定性地和定量地显示了与现有的最先进的无监督图像到图像转换任务相比所提出的方法的优越性。
translated by 谷歌翻译
在本文中,我们提出了一个生成的对抗性网络框架,它生成压缩图像而不是合成原始RGB图像并分别压缩它们。在现实世界中,大多数图像和视频以压缩格式存储和传输,以节省存储容量和数据传输带宽。然而,由于典型的生成对抗网络生成原始RGB图像,因此需要通过后处理阶段来压缩那些生成的图像以减小数据大小。在图像压缩方法中,JPEG是静止图像最常用的有损压缩方法之一。因此,我们提出了一种新的框架,使用生成对抗网络生成JPEG压缩图像。该新颖的发生器包括所提出的局部连接层,色度子采样层,量化层,残余块和卷积层。提出本地连接的层以启用基于块的操作。我们还讨论了所提出的架构的训练策略,包括损失函数和其生成器与其鉴别器之间的转换。使用公开可用的CIFAR-10数据集和LSUN bedroomdataset评估所提出的方法。结果表明,所提出的方法能够生成具有竞争品质的压缩数据。所提出的方法是使用生成对偶网络进行联合图像生成和压缩的有希望的基线方法。
translated by 谷歌翻译
在这项工作中,我们提出了一个随机森林框架,用于学习实时语义分割的特征表示的权重,形状和稀疏性。典型的过滤器(内核)具有预定的形状和稀疏度,并且仅学习权重。一些特征提取方法可以修复权重并只学习形状和稀疏性。这些预定约束限制了学习和提取最佳特征。为了克服这个限制,我们提出了一种无约束的表示,它能够通过学习权重,形状和稀疏度来提取最佳特征。然后,我们介绍随机森林框架,该框架使用迭代优化算法学习灵活过滤器,并使用学习的表示来分割输入图像。我们使用手分割数据集进行手对象交互并使用两个语义分割数据集来证明所提方法的有效性。结果表明,该方法利用有限的计算和内存资源实现了实时语义分割。
translated by 谷歌翻译