自动化规划是人工智能从一开始就是主要的研究领域之一。自动化规划研究旨在开发能够自动解决复杂问题的一般推荐者(即规划者)。从广义上讲,规划者依靠一个通用模型来描述世界的可能状态以及为改变世界地位而可以采取的行动。给定模型和初始已知状态,规划器的目标是合成实现特定目标状态所需的一组动作。经典的计划方法大致对应于上面给出的描述。基于时间轴的方法是一种特定的规划范例,能够在统一的求解过程中整合因果和时间推理。尽管缺少对相关规划概念的共同解释,但这种方法已成功应用于许多现实场景中。实际上,应用这种技术的现有框架之间存在显着差异。每个框架都依赖于自己对基于时间轴的规划的解释,因此比较这些系统并不容易。因此,这项工作的目的是通过解决从相关规划概念的语义到建模和求解技术的几个方面来研究基于时间线的规划方法。具体而言,该博士工作的主要贡献包括:(i)对基于时间线的方法进行非正式表征的提议,该方法能够处理时间不确定性; (ii)分层建模和解决方案的提议; (iii)制定一个用于规划与时间表的执行的通用框架; (iv)在现实世界的制造场景中验证这种方法的{\ dag}。
translated by 谷歌翻译
机器学习和统计学中的一项重要任务是通过支持离散点集的经验测度来近似概率测量。 Stein Points是用于该任务的一类算法,其通过顺序地最小化经验度量与目标之间的Stein差异来进行,因此需要解决非凸优化问题以获得每个新点。本文无需通过基于Markovchain样本路径选择每个新点来解决此优化问题。这显着降低了SteinPoints的计算成本,并导致一套简单易用的算法。新算法在一组具有挑战性的贝叶斯参考问题上得到了说明,并建立了严格的一致性理论保证。
translated by 谷歌翻译
在电子商务中,产品内容,尤其是产品图像对客户从产品发现到评估以及最终购买决策的过程具有重大影响。由于许多电子商务零售商除了自己以外从其他第三方市场卖家销售商品,因此内部和外部内容创作者发布的内容需要尽可能地进行监控。尽管有指导和警告,但包含令人反感和不合规的图像的产品列表仍会继续进入目录。过度和不合规的内容可能包含各种对象,徽标和横幅,传达暴力,色情,种族主义或促销信息。此类图像可能严重损害客户体验,导致容忍问题,并侵蚀公司品牌。在本文中,我们为超大型电子商务目录提供了机器学习驱动的攻击性和非合规图像检测系统。该系统在将这些内容发布到面向客户的网站之前,主动检测并删除这些内容。本文深入探讨了将机器学习应用于具有数亿产品图像的零售领域的实际数据的独特挑战。我们演示了如何解决出现在数以万计的产品类别中的不合规内容的问题。我们还描述了我们如何处理每个单一不合规情景出现的纯粹多样性。本文展示了一些实用但独特的方法,例如代表性培训数据创建,这对于解决极其严重的问题至关重要。总之,我们的系统结合了最先进的图像分类和对象检测技术,并对内部数据进行了精细调整,以开发针对大规模,多样化和不断发展的产品目录定制的解决方案。
translated by 谷歌翻译
最近对图嵌入方法的兴趣集中于学习图中每个节点的单个表示。但节点真的可以通过单个矢量表示最佳地描述吗?在这项工作中,我们提出了一种用于学习图中节点的多个表示的方法(例如,社交网络的用户)。基于自我网络的原则分解,每个表示将节点的角色编码在节点参与的不同本地社区中。这些表示允许改进图形中出现的细微差别关系的重构 - 我们通过各种图表上的链接预测任务的最新结果来说明这种现象,将错误减少高达$ 90 \%$。此外,我们表明这些嵌入允许对学习的社区结构进行有效的视觉分析。
translated by 谷歌翻译
无监督域自适应(UDA)相当于使用来自相关源域的数据集的标记实例,将类标签分配给来自目标域的数据集的未标记实例。在本文中,我们建议在游戏理论环境中将此问题作为非合作博弈进行演绎,并基于图形转换游戏(GTG)引入一种完全自动化的UDA迭代算法。这种方法的主要优点是其原则基础,保证终止迭代算法到纳什均衡(对应于一致的标记条件)和软标签量化标签分配过程的不确定性。我们还研究了使用线性分类器中的伪标签来初始化迭代过程的有益效果。在涉及浅和深特征的公开可用的对象识别基准数据集上评估所得方法的性能。实验结果证明了所提出的游戏理论方法对于解决UDA任务的适用性。
translated by 谷歌翻译
人机交互经常以从人类到机器人的指令的形式发生。为了使机器人成功地遵循指令,应该在人和机器人之间共享世界及其中的物体的共同表示,以便指令可以接地。实现这种代表性可以通过学习来完成,其中世界表示和语言基础是同时学习的。然而,在机器人中,由于数据的成本和稀缺性,这可能是一项艰巨的任务。在本文中,我们通过分别学习机器人的世界表示和语言基础来解决这个问题。虽然这种方法可以解决获得足够数据的挑战,但它可能会导致两个学习组件之间出现不一致。因此,我们进一步提出贝叶斯学习,通过利用人类给出的指令中隐含存在的空间关系信息来解决自然语言基础与机器人世界表征之间的这种不一致。此外,我们证明了我们的方法在物理世界中涉及机器人方案的可行性。
translated by 谷歌翻译
在本文中,我们提出使用称为确定性网格自适应直接搜索(MADS)算法和正交指向(Ortho-MADS)的黑盒优化方法来选择具有高斯核的支持向量机的超参数。与文献中利用数据属性或尝试最小化验证数据集在(C,伽马)的第一象限上的准确性的文献中的大多数方法不同,Ortho-MADS提供了收敛证明。我们提出了MADS,其次是theortho-MADS,由MADS网格大小和两种不同的搜索策略(Nelder-Mead和可变邻域搜索)定义的动态停止标准,它们有助于提高竞争收敛速度以及避免不希望的本地机制。极小。我们已经研究了具有高斯核的支持向量机的超参数的实际选择,即在几个基准数据集上正确地选择超参数伽马(带宽)和C(权衡)。实验结果表明,当使用通用配置时,所提出的超参数调整方法始终找到可比较或更好的解决方案,而不是其他方法。我们还使用Nelder-Mead搜索策略和使用网格尺寸作为停止标准的可变邻域搜索策略评估了Ortho-MADS的准确度和数量,并且我们已经达到了准确性,即没有其他方法可以达到超参数优化。
translated by 谷歌翻译
扬声器诚信度的自动测量是一种新颖的研究问题,计算副语言学。本文提出了基于协方差的特征向量来模拟支持向量回归量的语音和集合,以估计说话者的诚意程度。每个协方差vectorare的元素在短期特征组件之间成对统计。这些特征可单独使用,也可与ComParE声学特征组合使用。使用交叉验证程序对SinceritySpeech Corpus开发集的实验结果显示Spearman相关系数相对于基线系统的相对改善率为8.1%。
translated by 谷歌翻译
对抗性音频攻击可以被认为是对人耳敏感的小扰动,其被有意地添加到音频信号中并且引起机器学习模型以犯错误。这引起了对机器学习模型安全性的安全关注,因为对抗性攻击可以使这些模型朝向错误的预测。在本文中,我们首先回顾可能影响音频信号及其2D表示的强烈对抗性攻击,并评估最常见的机器学习模型的弹性,即深度学习模型和支持向量机(SVM)训练二维音频表示,如短时傅里叶变换(STFT),离散小波变换(DWT)和交叉复现图(CRP),针对几种最先进的对抗性攻击。接下来,我们提出了一种基于音频信号和SVM的预处理DWT表示的新方法,以保护音频系统免受对抗性攻击。所提出的架构具有若干预处理模块,用于生成和增强光谱图,包括尺寸减小和平滑。我们使用加速鲁棒特征(SURF)算法从小片谱图中提取特征,这些算法进一步用于使用K-Means ++算法生成码本。最后,码字用于在SURF生成的矢量的码本上训练SVM。所有这些步骤都产生了一种新颖的音频分类方法,它在准确性和弹性之间提供了良好的折衷。三个环境声音数据集的实验结果表明,与深度神经网络相比,所提出的方法在针对强对抗性攻击的准确性和鲁棒性方面具有竞争性。
translated by 谷歌翻译
本文提出了一种新的单通道图像低级解释模型。图像被分解为图形,该图形捕获结构特征的完整集合。该描述允许准确地识别每个位置及其正确的连接性。该方法的主要特征是:边缘的矢量描述,子像素精度和下行算法的并行性。该方法在概念和实验层面都优于经典和边缘检测器的状态。它还使基于图的算法能够进行更高级别的特征提取。任何图像处理流水线都可以受益于这样的结果:例如,受控去噪,边缘保持过滤,上采样,压缩,基于矢量和图形的模式匹配,神经网络训练。
translated by 谷歌翻译