本文基于从SCADA系统收集的数据,提出了一种新颖灵活的故障预测解决方案。基于数据驱动方法提供两种不同级别的故障预测:(a)通用故障/状态预测和(b)特定故障类预测,通过基于无监督聚类算法和模式识别神经网络的两种基于机器学习的模块实现分别是网络。模型已经在六个光伏(PV)工厂的公园进行了评估,该工厂的功率高达10兆瓦,而且还有三个不同技术品牌的一百个逆变器模块。结果表明,所提出的方法在以下方面是有效的:(a)提前7天预测受试者一般性故障,灵敏度高达95%;(b)预测特定故障类别的损坏,时间从几小时到7天不等。该模型可轻松部署,用于在新的光伏电站和技术上进行在线监测,只需要提供历史SCADA和故障数据,故障分类和逆变器电气数据表。关键词:数据挖掘,故障预测,逆变模块,KeyPerformance指标,丢失生产
translated by 谷歌翻译
鉴于最近NaturalLanguage Processing的转移学习取得了突破,自然语言推理取得了很大进展。不同的模型现在在SNLI,MNLI和SciTail等流行的推理数据集中呈现出高精度。同时,有不同的指示者可以通过使用一些简单的语言模式来利用这些数据集。这一事实给我们理解机器学习模型的实际能力以解决文本推理的复杂任务带来了困难。我们提出了一组新的任务,需要具有特定能力的过度语言逻辑形式,例如:i)布尔协调,ii)量词,iii)明确描述,以及iv)计算运算符。通过评估我们的分层数据集的模型,我们可以更好地确定模型在每种文本结构中的具体推理难度。我们评估隐含利用语言结构的两种神经模型:recurrentmodels和Transformer network BERT。我们表明,尽管BERT显然更有效地概括了大多数逻辑形式,但在处理计数操作符时仍有改进的空间。
translated by 谷歌翻译
使计算系统具有本地化基于视频的内容的能力具有多种应用。传统上,这种问题在完全监督的环境中被接受,其中提供围绕所关注的动作的具有完整的逐帧注释的视频剪辑。但是,在此设置中实现适当的一般化所需的数据要求是令人望而却步的。在这项工作中,我们通过在弱监督环境中投射问题来绕过这个问题,即通过将视频视为未标记视频片段的标记“集合”。首先,我们应用无监督分割来利用每个视频的基本结构。随后,使用卷积神经网络从所得到的视频片段中提取RGB特征。最后,采用多实例学习(MIL)来预测视频片段级别的标签,从而固有地执行时空动作检测。与之前的工作相反,我们使用不同的MIL公式,其中每个视频片段的标签是连续的而不是离散的,使得最终的优化功能易于处理。此外,我们利用集合分裂技术进行正则化。考虑UCF-Sports数据集上的多个性能指标的实验结果支持了我们的方法的有效性。
translated by 谷歌翻译
人物搜索最近引起了人们的注意,作为一种新的任务,即从非裁剪图像库中找到作为裁剪样本提供的人员,其中还可以看到其他几个人。我们相信我。应在联合优化框架中进行人员检测和重新识别,并且ii。人物搜索应该广泛利用查询图像(例如,强调独特的查询模式)。然而,到目前为止,没有priorart意识到这一点。我们引入了一种新颖的查询引导的端到端人员搜索网络(QEEPS)来解决这两个方面。我们利用最新的联合检测器和重新识别工作OIM [37]。我们用i扩展这个。使用来自查询和图库图像的全局上下文的aquery-guided Siamese挤压和激励网络(QSSE-Net),ii。查询引导的区域提议网络(QRPN)以产生与查询相关的提议,以及iii。 aquery-guided相似子网(QSimNet),用于学习查询引导的识别分数。 QEEPS是第一个端到端查询引导的检测和重新识别网络。在最近的CUHK-SYSU [37]和PRW [46]数据集中,我们都大大超过了之前的最新技术水平。
translated by 谷歌翻译
Many systems for autonomous vehicles' navigation rely on lane detection. Traditional algorithms usually estimate only the position of the lanes on the road, but an autonomous control system may also need to know if a lane marking can be crossed or not, and what portion of space inside the lane is free from obstacles, to make safer control decisions. On the other hand, free space detection algorithms only detect navigable areas, without information about lanes. State-of-the-art algorithms use CNNs for both tasks, with significant consumption of computing resources. We propose a novel approach that estimates the free space inside each lane, with a single CNN. Additionally, adding only a small requirement concerning GPU RAM, we infer the road type, that will be useful for path planning. To achieve this result, we train a multi-task CNN. Then, we further elaborate the output of the network, to extract polygons that can be effectively used in navigation control. Finally, we provide a computationally efficient implementation, based on ROS, that can be executed in real time. Our code and trained models are available online.
translated by 谷歌翻译
在本文中,我们提出使用生成性对抗网络(GAN)来生成机器学习任务的人工训练数据。人工训练数据的生成在诸如平衡数据集的情况下非常有用,执行类似于SMOTE或ADASYN的角色。当数据包含敏感信息时,它是有用的,并且希望尽可能避免使用原始数据集(例如:医疗数据)。我们使用不同的网络架构测试我们对基准数据集的建议,并显示决策树(使用由GAN生成的训练数据训练的DT)分类器与在原始数据集上训练的DT达到相同(并且令人惊讶地有时更好),准确性和回忆。
translated by 谷歌翻译
前列腺癌是男性中最常见的恶性肿瘤,但前列腺磁共振成像(MRI)分析仍然具有挑战性。除了整个前列腺腺体分割,区分中央腺体(CG)和外周区域(PZ)的模糊边界的能力可以导致不同的诊断,因为肿瘤的频率和严重程度在这些区域中不同。为了解决前列腺区域分割任务,我们提出了一种新的卷积神经网络(CNN),称为USE-Net,它将挤压和激发(SE)块合并到U-Net中。特别是,在每个编码器(Enc USE-Net)或编码器 - 解码器块(Enc-DecUSE-Net)之后添加SE块。本研究评估了基于CNN的体系结构对三个T2加权MRI数据集的泛化能力,每个数据集由不同数量的患者和异质图像特征组成,由不同的机构收集。以下混合方案用于训练/测试:(i)训练每个单独的数据集或多个前列腺MRI数据集,以及(ii)使用所有可能的训练/测试组合测试所有三个数据集。 USE-Net与三种最先进的基于CNN的架构(即U-Net,pix2pix和Mixed-ScaleDense网络)以及半自动连续最大流量模型进行比较。结果表明,数据集联合的训练通常分别优于每个数据集的应变,允许进行内/跨数据集的一般化。 Enc USE-Net在任何训练条件下都表现出良好的整体概括,而Enc-Dec USE-Net在训练所有数据集时显着优于其他方法。这些发现表明,当对训练期间使用的数据集的样本进行测试时,SE块的自适应特征重新校准提供了极好的交叉数据集推广。
translated by 谷歌翻译
Yask是一个在线社交协作网络,用于在框架中练习语言,包括请求,答案和投票。由于使用当前方法测量语言能力是困难的,昂贵的和非常多的情况不精确,我们提出了一种基于社交网络的新的替代方法。我们的方法,称为熟练等级,扩展了着名的页面排名算法,以衡量用户在协作社交图中的声誉。首先,我们扩展了网页排名,使其不仅考虑正链接(投票)而且考虑负链接。其次,除了使用显式链接之外,我们还在社交图中隐含了其他4种类型的信号。这些扩展允许熟练等级在所使用的数据集中产生几乎所有用户的熟练度排名,其中只有少数人通过应用来贡献,而多数只通过投票作出贡献。这克服了仅能够对具有传入链接的节点进行排名的页面排名的本质限制。我们的实验验证表明,Yask中用户的声誉/重要性与他们的语言熟练程度显着相关。相比之下,他们的书面作品与欧洲共同参考框架的词汇概况很不相关。此外,我们发现负信号(投票)比积极信号(投票)更具信息量。我们的结论是,即使是相对较小的人群,使用这种技术也是衡量第二语言能力的有前途的工具。
translated by 谷歌翻译
人的适应能力主要依赖于学习和合并知识的能力,包括有监督和无监督的学习:父母指出了重要的概念,然后孩子们自己填补了空白。这是特别有效的,因为有监督的学习永远不会是穷举的,因此自主学习可以发现有助于概括的不变性和不规则性。在本文中,我们建议将相似的方法应用于跨域的对象识别任务:我们的模型以监督的方式学习语义标签,并通过学习自我监督的信号扩展其对数据的理解,如何在相同的图像上解决拼图游戏。此次要任务有助于网络容忍空间关联的概念,同时充当分类任务的正则化器。在PACS,VLCS,Office-Home和数据集上进行的多次实验证实了我们的直觉,并表明这种简单的方法优于以前的领域泛化和适应解决方案。 Anablation研究进一步说明了我们的方法的内部运作。
translated by 谷歌翻译
尽管机器学习算法广泛用于解决技术,经济和社会相关性的问题,但是这些数据驱动算法的性能的可证实的保证是严重缺乏的,尤其是当数据源自不可靠的源并且被过度保护且易于访问的信道传输时。在本文中,我们采取了重要的步骤来弥合这一差距,并正式表明,为了优化准确性,二元分类算法 - 包括基于机器学习技术的算法 - 不可避免地对数据的对抗性操作变得更加敏感。此外,对于具有相同复杂度(即,分类边界的数量)的给定类别的算法,精度和灵敏度之间的基本交叉曲线仅取决于数据的统计,并且不能通过调整算法来改进。
translated by 谷歌翻译