本文基于从SCADA系统收集的数据,提出了一种新颖灵活的故障预测解决方案。基于数据驱动方法提供两种不同级别的故障预测:(a)通用故障/状态预测和(b)特定故障类预测,通过基于无监督聚类算法和模式识别神经网络的两种基于机器学习的模块实现分别是网络。模型已经在六个光伏(PV)工厂的公园进行了评估,该工厂的功率高达10兆瓦,而且还有三个不同技术品牌的一百个逆变器模块。结果表明,所提出的方法在以下方面是有效的:(a)提前7天预测受试者一般性故障,灵敏度高达95%;(b)预测特定故障类别的损坏,时间从几小时到7天不等。该模型可轻松部署,用于在新的光伏电站和技术上进行在线监测,只需要提供历史SCADA和故障数据,故障分类和逆变器电气数据表。关键词:数据挖掘,故障预测,逆变模块,KeyPerformance指标,丢失生产
translated by 谷歌翻译
本文提出了一种在自然法则的一般框架下理解感知学习过程的理论。神经网络被视为辅助系统,其连接是拉格朗日变量,即依赖于时间的函数。它们用于最小化认知行为,这是衡量代理与环境相互作用的适当功能指标。认知行为包含一个潜在的动力学术语,非常类似于机器学习中正则化的经典表述。功能指数的一个特殊选择,导致四阶微分方程 - 认知行为规律(CAL)---展示了一种反映机器学习的经典形式的结构。特别地,与机械的作用不同,平稳性条件对应于全局最小值。此外,证明了权重的典型渐近学习条件可以与初始化共存,条件是系统动力学在被称为信息过载控制的策略下被驱动。最后,该理论针对特征提取计算机视觉问题进行了实验。
translated by 谷歌翻译
总的来说,反向传播(BP)被认为是机器学习进程中最重要的神经计算算法之一,包括深度学习的最新进展。然而,它的计算结构已成为许多关于其可论证的生物学可行性的辩论的根源。在本文中,表明当在拉格朗日框架中构建监督学习时,虽然可以看到后传播的自然出现,但也可以设计出基于在权重,神经学组成的学习伴随空间中搜索鞍点的生物学似是而非的局部算法。输出和拉格朗日乘数。这可能打开了一个真正新颖的学习算法类型的大门,由于引入了支持神经元的概念,优化方案在构造体系结构中也发挥了重要作用。
translated by 谷歌翻译
深度神经架构的有效性得到了实验和基础原理的广泛支持。还有一种清晰的证据表明激活功能(例如整流器和LSTM单元)在学习的复杂性中起着至关重要的作用。基于这一说法,本文讨论了功能框架中神经元非线性的最佳选择,这是从经典正则化论证中得到启发的。结果表明,最佳激活函数由训练集中的核扩展表示,可以在建模1-D聚类的适当的点集上有效地近似。这个想法可以自然地扩展到循环网络,其中基于内核的激活功能的表现力被证明是捕获长期依赖性的关键因素。我们通过一系列具有挑战性的实验给出了这种性质的实验证据,其中我们将结果与基于现有技术LSTM细胞的神经结构进行比较。
translated by 谷歌翻译
当大多数成功的方法在图像层面工作时,计算机视觉的难题可能会找到新的具有挑战性的解决方案,这比直接处理视觉流更加困难,就像在自然界中一样。在本文中,我们声称它们的处理自然导致制定运动不变性原理,这使得能够构建基于卷积特征的新的视觉学习理论。该理论解决了许多引起自然视觉的有趣问题,并为在视网膜上发现卷积滤波器提供了良好的计算方案。它们是由最小认知行为原理推导出的欧拉 - 拉格朗日微分方程驱动的,它与力学定律相似。与需要大规模监督的传统卷积网络不同,所提出的理论提供了一种真正的新场景,其中通过无监督的视频信号处理来进行特征学习。我们展示了该理论的实验报告,其中我们表明在运动不变性下提取的特征产生了可以通过测量基于信息的指数来评估的改进。
translated by 谷歌翻译
总的来说,随机梯度的行为被认为是一个具有挑战性的问题,它经常出现在统计机器学习的框架中。本文提供了一种新的视角,分析了在处理基于耗散动力学的随机梯度的广义版本时出现的在线学习模型。为了面对这些模型的复杂演化,提出了一种基于单能平衡方程的系统处理方法,该方程是通过Caldirola-Kanai(CK)哈密顿量导出的。根据这些方程,学习可以看作是与损失函数递减相对应的无序过程。最后,本文建立的主要结果是在准周期环境中,模式新颖性随着时间的推移逐渐受到限制。通过,系统动力学在权重空间中产生渐近一致的解,即解决方案将相似的模式映射到相同的决策。
translated by 谷歌翻译
自动化规划是人工智能从一开始就是主要的研究领域之一。自动化规划研究旨在开发能够自动解决复杂问题的一般推荐者(即规划者)。从广义上讲,规划者依靠一个通用模型来描述世界的可能状态以及为改变世界地位而可以采取的行动。给定模型和初始已知状态,规划器的目标是合成实现特定目标状态所需的一组动作。经典的计划方法大致对应于上面给出的描述。基于时间轴的方法是一种特定的规划范例,能够在统一的求解过程中整合因果和时间推理。尽管缺少对相关规划概念的共同解释,但这种方法已成功应用于许多现实场景中。实际上,应用这种技术的现有框架之间存在显着差异。每个框架都依赖于自己对基于时间轴的规划的解释,因此比较这些系统并不容易。因此,这项工作的目的是通过解决从相关规划概念的语义到建模和求解技术的几个方面来研究基于时间线的规划方法。具体而言,该博士工作的主要贡献包括:(i)对基于时间线的方法进行非正式表征的提议,该方法能够处理时间不确定性; (ii)分层建模和解决方案的提议; (iii)制定一个用于规划与时间表的执行的通用框架; (iv)在现实世界的制造场景中验证这种方法的{\ dag}。
translated by 谷歌翻译
机器学习和统计学中的一项重要任务是通过支持离散点集的经验测度来近似概率测量。 Stein Points是用于该任务的一类算法,其通过顺序地最小化经验度量与目标之间的Stein差异来进行,因此需要解决非凸优化问题以获得每个新点。本文无需通过基于Markovchain样本路径选择每个新点来解决此优化问题。这显着降低了SteinPoints的计算成本,并导致一套简单易用的算法。新算法在一组具有挑战性的贝叶斯参考问题上得到了说明,并建立了严格的一致性理论保证。
translated by 谷歌翻译
在电子商务中,产品内容,尤其是产品图像对客户从产品发现到评估以及最终购买决策的过程具有重大影响。由于许多电子商务零售商除了自己以外从其他第三方市场卖家销售商品,因此内部和外部内容创作者发布的内容需要尽可能地进行监控。尽管有指导和警告,但包含令人反感和不合规的图像的产品列表仍会继续进入目录。过度和不合规的内容可能包含各种对象,徽标和横幅,传达暴力,色情,种族主义或促销信息。此类图像可能严重损害客户体验,导致容忍问题,并侵蚀公司品牌。在本文中,我们为超大型电子商务目录提供了机器学习驱动的攻击性和非合规图像检测系统。该系统在将这些内容发布到面向客户的网站之前,主动检测并删除这些内容。本文深入探讨了将机器学习应用于具有数亿产品图像的零售领域的实际数据的独特挑战。我们演示了如何解决出现在数以万计的产品类别中的不合规内容的问题。我们还描述了我们如何处理每个单一不合规情景出现的纯粹多样性。本文展示了一些实用但独特的方法,例如代表性培训数据创建,这对于解决极其严重的问题至关重要。总之,我们的系统结合了最先进的图像分类和对象检测技术,并对内部数据进行了精细调整,以开发针对大规模,多样化和不断发展的产品目录定制的解决方案。
translated by 谷歌翻译
最近对图嵌入方法的兴趣集中于学习图中每个节点的单个表示。但节点真的可以通过单个矢量表示最佳地描述吗?在这项工作中,我们提出了一种用于学习图中节点的多个表示的方法(例如,社交网络的用户)。基于自我网络的原则分解,每个表示将节点的角色编码在节点参与的不同本地社区中。这些表示允许改进图形中出现的细微差别关系的重构 - 我们通过各种图表上的链接预测任务的最新结果来说明这种现象,将错误减少高达$ 90 \%$。此外,我们表明这些嵌入允许对学习的社区结构进行有效的视觉分析。
translated by 谷歌翻译