Clustering is a fundamental problem in many areas, which aims to partition a given data set into groups based on some distance measure, such that the data points in the same group are similar while that in different groups are dissimilar. Due to its importance and NP-hardness, a lot of methods have been proposed, among which evolutionary algorithms are a class of popular ones. Evolutionary clustering has found many successful applications, but all the results are empirical, lacking theoretical support. This paper fills this gap by proving that the approximation performance of the GSEMO (a simple multi-objective evolutionary algorithm) for solving the three popular formulations of clustering, i.e., $k$-center, $k$-median and $k$-means, can be theoretically guaranteed. Furthermore, we prove that evolutionary clustering can have theoretical guarantees even when considering fairness, which tries to avoid algorithmic bias, and has recently been an important research topic in machine learning.
translated by 谷歌翻译
在计算机音乐和心理声学中,感知响度与身体属性之间的关系是一个重要的主题。对“相等大通轮廓”的早期研究可以追溯到1920年代,从那以后,对强度和频率进行了测量的响度已被修订了多次。然而,大多数研究仅关注合成的声音,并且很少有合理的自然色调理论。为此,我们通过建模钢琴音调在本文中研究了天然音调感知的理论和应用。该理论部分包含:1)对音高的钢琴相等大小轮廓的准确测量,以及2)一个机器学习模型,能够纯粹基于基于人类主题测量的光谱特征来推断响度。至于应用程序,我们将理论应用于钢琴控制转移,其中我们调整了两个不同玩家钢琴(在不同的声学环境中)上的MIDI速度,以达到相同的感知效果。实验表明,我们的理论响度建模和相应的性能控制转移算法都显着优于其基准。
translated by 谷歌翻译
可以通过看不见的合作伙伴生成可以实现零拍打协调(ZSC)的代理是在合作多代理增强学习(MARL)中的新挑战。最近,一些研究通过在培训过程中将代理暴露于不同的伴侣中,从而在ZSC中取得了进展。他们通常在训练伴侣时涉及自我竞争,因为他们隐含地假设任务是同质的。但是,许多现实世界的任务都是异质的,因此以前的方法可能会失败。在本文中,我们首次研究了异质ZSC问题,并提出了一种基于协同进化的通用方法,该方法通过三个子过程进行了协调的两个代理和合作伙伴种群:配对,更新和选择。协作烹饪任务的实验结果表明需要考虑异质环境,并说明我们所提出的方法是异构合作MARL的有前途解决方案。
translated by 谷歌翻译
最近开发的基于粒子的变分推理(PARVI)方法通过迭代更新粒子的位置驱动一组\ EMPH {固定权重}粒子的经验分布。然而,固定的重量限制大大限制了经验分布的近似能力,特别是当粒子数有限时。在本文中,我们提出根据Fisher-Rao反应流动动态调整粒子的重量。我们根据新颖的连续复合流动开发了一种通用的动态重量粒子变分推理(DPVI)框架,其同时演化颗粒的位置和重量。我们表明,我们的复合流的平均场限制实际上是某些不相似函数$ \ mathcal {f} $的Wasserstein-fisher-Rao梯度流量,这导致$ \ mathcal {f} $的速度更快地减少Wassersein梯度流动现有的固定重量帕维。通过在我们的总框架中使用不同的有限粒子近似,我们推出了几种高效的DPVI算法。经验结果展示了我们的固定重量对应物的衍生DPVI算法的优越性。
translated by 谷歌翻译
从智能制造收集的数据的不断增长的可用性正在改变生产监测和控制的范式。除了时变的意外的扰动和不确定性之外,晶片制造过程的复杂性和内容的增加,使得用基于模型的方法进行控制过程,使控制过程不可行。结果,数据驱动的软感测建模在晶圆过程诊断中变得更加普遍。最近,在高度非线性和动态时间序列数据中具有高度性能的软感测系统中已经利用了深度学习。然而,尽管它在软感动系统中取得了成功,但深层学习框架的潜在逻辑很难理解。在本文中,我们提出了一种使用高度不平衡数据集的缺陷晶片检测的深度学习模型。要了解所提出的模型如何工作,应用了深度可视化方法。另外,该模型然后通过深度可视化指导进行微调。进行广泛的实验以验证所提出的系统的有效性。结果提供了一种解释模型工作原理和基于解释的有效微调方法的解释。
translated by 谷歌翻译
在过去的几十年中,现代工业过程研究了几种具有成本效益的方法,以提高半导体制造的生产率和产量。虽然在促进实时监控和控制方面发挥重要作用,但行业中的数据驱动的软传感器在增强了晶圆故障诊断的深度学习方法时提供了竞争优势。尽管各个领域的深度学习方法取得了成功,但它们倾向于在多变化的软感测数据域上遭受不良性能。为了缓解这一点,我们提出了一种用于晶圆故障诊断分类任务的软感应集合器(卷积式变压器),主要由多头卷积模块组成,可获得快速和轻量级操作的卷曲的益处,以及能力通过多头设计相同的变压器来学习强大的表示。另一个关键问题是传统的学习范式倾向于在嘈杂和高度不平衡的软感测数据上遭受低性能。为了解决这个问题,我们使用基于课程的课程的损失函数增强了我们的软感测符合子模型,这有效地在培训的早期阶段和困难的阶段中学习易于样本。为了进一步展示我们拟议的架构的效用,我们对希捷技术的晶圆制造过程的各种工具进行了广泛的实验,这些工具与这项工作一起分享。据我们所知,这是第一次提出了课程,为软感测数据提出了基于课程的软感测符合子架构,我们的结果表明未来在软传感研究领域的使用中有很强的承诺。
translated by 谷歌翻译
在大数据的时代,基于数据驱动的分类已成为智能制造业的基本方法,以指导生产和优化检查。实践中获得的工业数据通常是由软传感器收集的时间序列数据,这是高度非线性,非间断,不平衡和嘈杂的。大多数现有的软传感机器学习模型侧重于捕获串联内部时间依赖关系或预定义的序列间相关性,同时忽略标签之间的相关性,每个实例同时与多个标签相关联。在本文中,我们提出了一种基于曲线的新颖的曲线图,用于多变量时间序列分类噪声和高度不平衡的软感测数据。所提出的基层能够在光谱域中捕获串联串联和串联系列依赖项; 2)通过叠加由统计共生信息构建的标签图来利用标签相关性; 3)从文本和数值域中使用注意机制学习功能; 4)利用未标记的数据并通过半监督学习缓解数据不平衡。与其他常用分类器的比较研究在希捷软感测数据上进行,实验结果验证了我们提出的方法的竞争性能。
translated by 谷歌翻译
最佳运输(OT)自然地出现在广泛的机器学习应用中,但可能经常成为计算瓶颈。最近,一行作品建议大致通过在低秩子空间中搜索\ emph {transport计划}来解决OT。然而,最佳运输计划通常不是低秩,这往往会产生大的近似误差。例如,当存在Monge的\ EMPH {Transport Map}时,运输计划是完整的排名。本文涉及具有足够精度和效率的OT距离的计算。提出了一种用于OT的新颖近似,其中运输计划可以分解成低级矩阵和稀疏矩阵的总和。理论上我们分析近似误差。然后设计增强拉格朗日方法以有效地计算运输计划。
translated by 谷歌翻译
随着近年来AI技术的快速发展,柔软传感区域的深层学习模型有很多研究。然而,该模型已经变得更加复杂,但数据集保持有限:研究人员用数百个数据样本拟合百万参数模型,这不足以行使其模型的有效性,因此在工业中实施时通常无法执行应用程序。为解决这一持久的问题,我们正在为公众提供大规模的高维时间序列制造传感器数据。我们展示了这些数据集上软感应变压器模型建模工业大数据的挑战和有效性。使用变压器,因为,它在自然语言处理中表现出优于最先进的技术,从直接应用到计算机视觉时也表现良好,而不引入图像特定的感应偏差。我们观察句子结构与传感器读数的相似性,并以自然语言中的句子类似的方式处理多变量传感器读数。高维时间序列数据被格式化成相同的嵌入式句子,并馈入变压器模型。结果表明,基于自动编码器和长短期存储器(LSTM)模型,变压器模型优于软感测场中的基准模型。据我们所知,我们是学术界或工业的第一支球队,以利用大规模数值软感测数据基准原始变压器模型的性能。
translated by 谷歌翻译
过去几年的对抗性文本攻击领域已经大大增长,其中常见的目标是加工可以成功欺骗目标模型的对抗性示例。然而,攻击的难以察觉,也是基本目标,通常被以前的研究遗漏。在这项工作中,我们倡导同时考虑两个目标,并提出一种新的多优化方法(被称为水合物转速),具有可提供的绩效保证,以实现高稳定性的成功攻击。我们通过基于分数和决策的设置,展示了HydroText通过广泛实验的效果,涉及五个基于基准数据集的现代NLP模型。与现有的最先进的攻击相比,Hydratext同时实现了更高的成功率,更低的修改率和与原始文本更高的语义相似性。人类评估研究表明,由水分精制成的对抗例保持良好的有效性和自然。最后,这些例子也表现出良好的可转移性,并且可以通过对抗性培训为目标模型带来显着的稳健性。
translated by 谷歌翻译