我们的艺术家和机器学习研究团队设计了一种创造性算法,可以生成真正的雕塑艺术品。这些艺术品不会模仿任何给定的形式,也不能轻易归类为数据集类别。我们的方法将DeepDream从图像扩展到3D点云。提出的算法,Amalgamated DeepDream(ADD),利用点云的属性来创建比天真扩展更好的对象.ADD为机器的创造力提供了希望,推动艺术家探索新方法或材料的创造力,并创造新的类型而不是在onegenre中创建现有表单或样式的变体。例如,从现实主义到抽象表现主义,或极简主义。最后,我们展示了基于ADD创建的点云进行3D打印的雕塑。
translated by 谷歌翻译
今天的机器人系统越来越多地转向计算上昂贵的模型,例如深度神经网络(DNN),用于定位,感知,计划和对象检测等任务。然而,资源受限的机器人,如低功率无人机,通常没有足够的机载计算资源或功率储备来可扩展地运行最准确的,最先进的网络计算模型。云机器人技术允许移动机器人将计算机卸载到集中式服务器,如果它们在本地不确定或想要运行更准确的计算密集型模型。然而,云机器人成为一个关键的,通常低估的成本:与云过度拥塞的无线网络通信可能导致延迟或数据丢失。实际上,通过拥塞网络从多个机器人发送高数据速率视频或LIDAR会导致实时应用程序的延迟过高,我们会通过实验测量。在本文中,我们制定了一个新的机器人卸载问题---机器人如何以及何时卸载传感任务,特别是如果它们不确定,在提高准确性的同时最大限度地降低云通信的成本?我们将卸载制定为机器人的顺序决策问题,并提出使用深度强化学习的解决方案。在使用最先进的视觉DNN的模拟和硬件实验中,我们的卸载策略将视觉任务性能提高了1.3-2.6倍的基准标记卸载策略,使机器人有可能显着超越其板载传感精度,但云通信成本有限。
translated by 谷歌翻译
转型人工智能技术有可能在不久的将来重塑社会的关键方面。但是,为了适当地为这些技术的到来准备政策,需要准确的预测和时间表。在2018年夏季(ICML,IJCAI和HLAI会议)对三个AI会议的与会者进行了一项调查。该调查包括在下一个十年评估AI能力的问题,预测变革AI的五个场景的问题以及关于计算影响的问题。人工智能研究中的资源。受访者表示,人工任务的中位数为21.5%(即人工目前支付的所有任务)现在可以实现自动化,并且这个数字将在5年内上升到40%,在10年内上升到60% 。中位数预测表明,人工智能系统有50%的概率能够在25年内实现90%的当前人工任务自动化,并在50年内实现99%的当前人工任务。发现出席会议对所有预测产生了统计上的显着影响,HLAI的与会者提供了更加乐观的时间表,而且不确定性较低。这些研究结果表明,人工智能专家预计人工智能技术的重大发展将在未来十年内持续到可能对社会产生深远变革影响的程度。
translated by 谷歌翻译
无监督图像转换旨在学习在给定未配对训练数据的情况下从源域到另一个目标域的转换。一些最先进的作品在GANs-basedunsupervised图像到图像翻译中取得了令人瞩目的成果。与纹理更改任务(如样式转换)相比,它无法捕获域之间的强几何或结构变化,或者对于复杂场景不能令人满意。最近,SAGAN(HanZhang,2018)表明,自我关注网络比基于卷积的GAN产生更好的结果。然而,这些注意网络在无监督的图像到图像转换任务中的有效性尚未得到验证。在本文中,我们提出了一种具有自我关注网络的无监督图像到图像的翻译,其中远程依赖性不仅有助于捕获强烈的几何变化,而且还可以使用来自所有特征位置的细节来生成细节。在实验中,我们定性地和定量地显示了与现有的最先进的无监督图像到图像转换任务相比所提出的方法的优越性。
translated by 谷歌翻译
在本文中,我们提出了一个生成的对抗性网络框架,它生成压缩图像而不是合成原始RGB图像并分别压缩它们。在现实世界中,大多数图像和视频以压缩格式存储和传输,以节省存储容量和数据传输带宽。然而,由于典型的生成对抗网络生成原始RGB图像,因此需要通过后处理阶段来压缩那些生成的图像以减小数据大小。在图像压缩方法中,JPEG是静止图像最常用的有损压缩方法之一。因此,我们提出了一种新的框架,使用生成对抗网络生成JPEG压缩图像。该新颖的发生器包括所提出的局部连接层,色度子采样层,量化层,残余块和卷积层。提出本地连接的层以启用基于块的操作。我们还讨论了所提出的架构的训练策略,包括损失函数和其生成器与其鉴别器之间的转换。使用公开可用的CIFAR-10数据集和LSUN bedroomdataset评估所提出的方法。结果表明,所提出的方法能够生成具有竞争品质的压缩数据。所提出的方法是使用生成对偶网络进行联合图像生成和压缩的有希望的基线方法。
translated by 谷歌翻译
在这项工作中,我们提出了一个随机森林框架,用于学习实时语义分割的特征表示的权重,形状和稀疏性。典型的过滤器(内核)具有预定的形状和稀疏度,并且仅学习权重。一些特征提取方法可以修复权重并只学习形状和稀疏性。这些预定约束限制了学习和提取最佳特征。为了克服这个限制,我们提出了一种无约束的表示,它能够通过学习权重,形状和稀疏度来提取最佳特征。然后,我们介绍随机森林框架,该框架使用迭代优化算法学习灵活过滤器,并使用学习的表示来分割输入图像。我们使用手分割数据集进行手对象交互并使用两个语义分割数据集来证明所提方法的有效性。结果表明,该方法利用有限的计算和内存资源实现了实时语义分割。
translated by 谷歌翻译
作为无人驾驶车辆和智能机器人的基础,同时定位与映射(SLAM)近来备受关注。然而,传统SLAM算法的非几何模块受到数据关联任务的限制,已成为阻碍SLAM发展的瓶颈。为了解决这些问题,许多研究人员寻求深度学习帮助。但是大多数这些研究仅限于虚拟数据集或特定环境,甚至牺牲了准确性的效率。因此,它们不够实用。我们提出了DF-SLAM系统,该系统使用神经网络获得的深度局部特征描述符代替传统的手工制作特征。实验结果证明了其在效率和稳定性方面的改进.DF-SLAM在各种场景中优于流行的传统SLAM系统,包括具有挑战性强烈照明变化的场景。其多功能性和移动性非常适合探索新环境的需求。由于我们采用浅网络来提取本地描述符并保留其他原始SLAM系统,我们的DF-SLAM仍然可以在GPU上实时运行。
translated by 谷歌翻译
句子嵌入是天然语言处理(NLP)领域的重要研究课题。生成反映句子内在意义的句子嵌入向量是在各种NLP任务(例如句子分类和文档化)中实现增强性能的关键因素。因此,在关于词的分布式表示的研究出现之后,已经提出了基于监督和非监督学习的各种句子嵌入模型。它们通过语义文本相似性(STS)任务进行评估,这些任务测量句子的语义保存程度,并且基于神经网络的监督嵌入模型通常产生最先进的性能。然而,这些模型具有更新的参数,因为它们具有多个要更新的参数,因此需要大量标记的训练数据。在这项研究中,我们提出了一种有效的方法,可以学习一个转换矩阵,该矩阵可以优化句子嵌入向量,以反映句子的潜在语义。该方法具有两个实际优点; (1)它可以应用于任何嵌入方法,(2)它可以在STStasks中实现稳健的性能,而不管训练样例的数量。
translated by 谷歌翻译
在本文中,我们建议学习具有相关对齐($ {S} ^ {3} CA $)的共模语义空间,用于多模态数据表示,其对齐为异构数据设计的深度神经网络中的多模态数据分布的非线性相关性。在跨模态(事件)检索的背景下,我们设计了一个具有卷积层和连接层的神经网络,以提取图像的特征,包括类似于Flickr的社交媒体上的图像。同时,我们利用一个完全连接的神经网络来提取文本的语义特征,包括来自新闻媒体的新闻文章。特别地,两个神经网络中的层激活的非线性相关性与网络的联合训练期间的相关对准对齐。此外,我们将多模态数据投影到用于跨模态(事件)检索的ashared语义空间,其中可以直接测量异构数据样本之间的距离。此外,我们贡献了一个Wiki-Flickr事件数据集,其中多模态数据样本不像现有的配对数据集那样成对地相互描述,但它们都描述了语义事件。在配对和非配对数据集上进行的大量实验表明$ {S} ^ {3} CA $的有效性,优于最先进的方法。
translated by 谷歌翻译
无监督域适应(UDA)对目标域进行预测,而手动注释仅在源域中可用。以前的方法可以最大限度地减少域差异,忽略类信息,这可能导致错位和泛化性能差。为了解决这个问题,本文提出了对比适应网络(CAN)优化新的度量,它明确地模拟了类内域差异和类间域差异。我们设计了一种以端到端方式加速CAN的交替更新策略。在两个真实世界的基准测试中的实验表明,CAN-31和VisDA-2017表明CAN对最先进的方法表现出色,并产生更多的辨别特征。我们很快就会发布代码。
translated by 谷歌翻译