本文基于从SCADA系统收集的数据,提出了一种新颖灵活的故障预测解决方案。基于数据驱动方法提供两种不同级别的故障预测:(a)通用故障/状态预测和(b)特定故障类预测,通过基于无监督聚类算法和模式识别神经网络的两种基于机器学习的模块实现分别是网络。模型已经在六个光伏(PV)工厂的公园进行了评估,该工厂的功率高达10兆瓦,而且还有三个不同技术品牌的一百个逆变器模块。结果表明,所提出的方法在以下方面是有效的:(a)提前7天预测受试者一般性故障,灵敏度高达95%;(b)预测特定故障类别的损坏,时间从几小时到7天不等。该模型可轻松部署,用于在新的光伏电站和技术上进行在线监测,只需要提供历史SCADA和故障数据,故障分类和逆变器电气数据表。关键词:数据挖掘,故障预测,逆变模块,KeyPerformance指标,丢失生产
translated by 谷歌翻译
深度学习提出了希望和期望,作为许多应用程序的一般解决方案;事实证明它已被证明是有效的,但它也显示出对大量数据的强烈依赖性。幸运的是,已经证明,即使数据稀缺,也可以通过重复使用priorknowledge来训练成功的模型。因此,在最广泛的定义中,开发转移学习技术是部署有效和准确的智能系统的关键因素。本文将重点研究一系列适用于视觉目标识别任务的转移学习方法,特别是图像分类。转移学习是一个通用术语,并且特定设置已经给出了特定的名称:当学习者只能访问来自目标域的标记数据和来自不同域(源)的标记数据时,问题被称为“无监督域适应”。 (DA)。这项工作的第一部分将集中在这个设置的三种方法:其中一种方法涉及特征,一种是图像,而第三种方法同时使用两种。第二部分将重点关注机器人感知的现实生活问题,特别是RGB-D识别。机器人平台通常不仅限于色彩感知;他们经常带着Depthcamera。不幸的是,深度模态很少用于视觉识别,因为缺乏预先训练的模型,从中可以传输并且很少有数据从头开始。将提出两种处理这种情况的方法:一种使用合成数据,另一种利用跨模态转移学习。
translated by 谷歌翻译
在社交媒体和大数据时代,视觉证据的使用冲突和侵犯人权已成为人权组织和倡导者的重要内容。在本文中,我们讨论了在具有挑战性的日常照片中检测两种类型的侵犯人权行为的任务:(1)童工,(2)流离失所的人口。我们提出了一种以人为中心的方法驱动的新模型。我们的假设是,一个人的情绪状态 - 一种情绪是多么积极或愉快,以及一个人对情况的控制水平 - 是感知潜在的人权侵犯的有力线索。为了利用这些线索,我们的模型学习基于对每个检测到的人和整个场景的联合分析来预测给定图像上的全局特征。通过将这些预测与adata驱动的卷积神经网络(CNN)分类器相结合,我们系统地在一个干净的端到端系统中推断潜在的人权滥用,我们称之为GET-AID(来自全球情感特征的滥用识别)。广泛的实验是为验证我们最近引入的人权档案(HRA)数据集子集(2个违反类别,具有相同数量的正面和负面样本)的方法,我们展示了定量引人注目的结果。与之前的作品和CNN分类器的独家使用相比,本文将儿童劳动力的覆盖率提高了23.73%,流离失所人口的覆盖率提高了57.21%。我们的数据集,代码和培训模型可在线访问https://github.com/GKalliatakis/GET-AID。
translated by 谷歌翻译
压缩是计算机科学中的一个重要主题,它允许我们在数据存储上存储更多数据。有几个techniquesto压缩任何文件。在本文中将描述压缩JPEG等图像的最重要的算法,并将其与另一种方法进行比较,以找出在图像上不使用此方法的充分理由。因此,为了比较文本,已知的最多编码技术是霍夫曼编码,它将以详尽的方式解释。在这篇手稿中将展示如何在图像上计算文本压缩方法,特别是如何选择相对于另一个的确定图像格式的方法和原因。在该手稿中研究和分析的方法是重新配对算法,其对于语法上下文来说是压缩的。在,并将显示该应用程序的良好结果。
translated by 谷歌翻译
合成图像生成和操纵的快速进展现在已经到了这一点,它引起了人们对社会影响的重大关注。充其量,这会导致对数字内容失去信任,但它甚至可能通过散布虚假信息和创造虚假新闻而造成进一步的伤害。在本文中,我们研究了最先进的图像操作的真实性,以及检测它们的难度 - 无论是自动还是人类。特别是,我们专注于DeepFakes,Face2Face和FaceSwap作为面部操作的主要代表。我们分别为每种方法创建了超过一半的操作图像。由此产生的公共数据集至少比可比较的替代方案大一个数量级,它使我们能够以受监督的方式训练数据驱动的伪造检测器。我们表明,即使在强压缩的情况下,使用额外的特定领域知识也可以将伪造检测提高到前所未有的精度。通过一系列的实验,我们量化了经典方法,新型深度学习方法和人类观察者表现之间的差异。
translated by 谷歌翻译
具有大量鞍点的损失函数是训练许多现代机器学习模型的主要障碍之一。梯度下降(GD)是用于机器学习的基本算法,并且针对某些初始数据收敛到鞍点。我们将这些初始值形成的区域称为“吸引区域”。对于二次函数,如果初始数据位于最多n-1维的子空间中,则GD收敛到asaddle点。在本文中,我们证明了最近提出的拉普拉斯平滑梯度下降(LSGD)[Osher,et al。,arXiv:1806.06317]的一个小修改有助于避免鞍点而不牺牲GD的收敛速度。特别地,我们证明了LSGD吸引区域的维数对于一类二次函数而言最多是一层((n-1)/ 2),该二次函数明显小于GD的(n-1)维吸引区域。
translated by 谷歌翻译
音乐推荐的关键点之一是根据情感和情感创作引人入胜的播放列表。虽然以前的作品大多是基于音频发现和播放列表生成的音频,但我们利用我们同步的歌词数据集以新颖的方式组合文本表示和音乐特征;因此,我们引入了同步歌词情感数据集。与其他随机利用音频样本和全文的方法不同,我们的数据根据​​歌词和音频之间的同步提供的时间信息进行分割。这项工作展示了使用来自自然语言处理和音乐信息检索域的不同技术的基于文本和基于音频的深度学习分类模型之间的比较。从音频实验中我们得出结论,仅使用人声而不是整个音频数据改善了音频分类器的整体性能。在歌词实验中,我们利用应用于文学中可用的主要深度学习架构的最先进的词语表示。在我们的基准测试中,结果显示基于快速文本字嵌入的基于注意的双线性LSTM分类器如何比在音频上应用CNN更好。
translated by 谷歌翻译
在文本语料库上训练的神经语言模型可以用于诱导单词的分布表示,使得相似的单词最终具有相似的表示。如果语料库是多语言的,则可以使用相同的模型来学习语言的分布式表示,使得类似语言最终具有类似的表示。我们表明,即使将多语言语料库翻译成英语,通过拾取源语言留下的微弱信号,这仍然存在。然而,就像在单词表示中将语义与句法相似性分开是一个棘手的问题一样,语言表征捕获的是什么类型的相似性并不明显。我们研究了一方面从翻译中学习的语言表征与另一方面语言之间的遗传,地理和几个层次结构相似性之间的相关性和因果关系。其中,结构相似性与语言表征相似性强烈相关,而遗传关系 - 用于前期工作评估的方便基准 - 似乎是一个混淆因素。除了对翻译效应的影响之外,我们更普遍地将其视为NLP和语言类型学可以相互作用并互相受益的情况。
translated by 谷歌翻译
机器学习系统定期处理实际应用中的结构化数据。遗憾的是,这种数据难以以大多数机器学习技术所期望的方式忠实地表示,即作为固定的预定大小的实值向量。在这项工作中,我们介绍了一种新方法,它将结构化数据编译成一个可满足性问题,该问题在其解决方案集中至少(通常只有)输入数据。可满足性问题由约束构成,这些约束是从给定签名先验地自动生成的,因此可以简单地允许构造输入的单词 - 矢量表示。方法在两个方面进行了演示,即自动推理和自然语言处理,在这些方面,它被证明在生成自然语言句子的矢量表示和一阶逻辑子句方面几近完美,可以将其转换回原始的结构化输入形式。
translated by 谷歌翻译
小脑灰质形态是研究阿尔茨海默病或唐氏综合症等神经退行性疾病的重要特征。其体积或厚度通常用作此类疾病的替代成像生物标志物。大多数关于灰质厚度估算的研究都集中在心脏上,而对于小脑的形态学的研究很少。使用离体高分辨率MRI,现在可以可视化小鼠小脑中的不同细胞层。在这项工作中,我们引入了框架来提取灰质内的Purkinje层,从而能够估计小脑灰质的厚度,颗粒层和钆增强离体小鼠脑MRI的分子层。应用于唐氏综合征小鼠模型发现转染色体组皮质和layerthickness减少。
translated by 谷歌翻译