本文研究了如何训练直接近似约束优化问题的最佳解决方案的机器学习模型。这是在约束下的经验风险最小化,这是具有挑战性的,因为培训必须平衡最佳和可行性条件。监督学习方法通​​常通过在大量预处理实例中训练模型来应对这一挑战。本文采用了不同的途径,并提出了原始偶尔学习的想法(PDL),这是一种自我监督的培训方法,不需要一组预处理的实例或用于培训和推理的优化求解器。取而代之的是,PDL模拟了增强拉格朗日方法(ALM)的轨迹,并共同训练原始和双神经网络。作为一种原始的双重方法,PDL使用用于训练原始网络的损失函数中的约束项的实例特定惩罚。实验表明,在一组非线性优化基准上,PDL通常表现出可忽略的约束违规和较小的最佳差距,并且非常接近ALM优化。与现有方法相比,PDL在最佳差距,约束违规和培训时间方面还表现出改善或类似的性能。
translated by 谷歌翻译
Non-convex AC optimal power flow (AC-OPF) is a fundamental optimization problem in power system analysis. The computational complexity of conventional solvers is typically high and not suitable for large-scale networks in real-time operation. Hence, deep learning based approaches have gained intensive attention to conduct the time-consuming training process offline. Supervised learning methods may yield a feasible AC-OPF solution with a small optimality gap. However, they often need conventional solvers to generate the training dataset. This paper proposes an end-to-end unsupervised learning based framework for AC-OPF. We develop a deep neural network to output a partial set of decision variables while the remaining variables are recovered by solving AC power flow equations. The fast decoupled power flow solver is adopted to further reduce the computational time. In addition, we propose using a modified augmented Lagrangian function as the training loss. The multipliers are adjusted dynamically based on the degree of constraint violation. Extensive numerical test results corroborate the advantages of our proposed approach over some existing methods.
translated by 谷歌翻译
要将计算负担从实时到延迟关键电源系统应用程序的脱机,最近的作品招待使用深神经网络(DNN)的想法来预测一次呈现的AC最佳功率流(AC-OPF)的解决方案负载需求。随着网络拓扑可能改变的,以样本有效的方式训练该DNN成为必需品。为提高数据效率,这项工作利用了OPF数据不是简单的训练标签,而是构成参数优化问题的解决方案。因此,我们倡导培训一个灵敏度通知的DNN(SI-DNN),不仅可以匹配OPF优化器,而且还匹配它们的部分导数相对于OPF参数(负载)。结果表明,所需的雅可比矩阵确实存在于温和条件下,并且可以从相关的原始/双解决方案中容易地计算。所提出的Si-DNN与广泛的OPF溶剂兼容,包括非凸出的二次约束的二次程序(QCQP),其半纤维程序(SDP)放松和MatPower;虽然Si-DNN可以在其他学习到OPF方案中无缝集成。三个基准电源系统的数值测试证实了SI-DNN在传统训练的DNN上预测的OPF解决方案的高级泛化和约束满意度,尤其是在低数据设置中。
translated by 谷歌翻译
由于固有的DNN预测误差,确保解决方案可行性是开发用于解决受约束优化问题的深度神经网络(DNN)方案的关键挑战。在本文中,我们提出了一种“预防性学习”的框架,以系统地保证DNN解决方案可行性的凸起约束和一般客观函数的问题。我们首先应用预测和重建设计,不仅保证平等约束,还可以利用它们来减少DNN预测的变量的数量。然后,作为关键方法贡献,我们系统地校准了DNN训练中使用的不等式约束,从而预测预测误差并确保所得到的解决方案仍然可行。我们表征校准量大和DNN尺寸,足以确保通用可行性。我们提出了一种新的敌对样本意识到培训算法,以改善DNN的最优性能而不牺牲可行性保证。总的来说,该框架提供了两个DNN。表征足够的DNN大小的第一个可以保证通用可行性,而来自所提出的培训算法的另一个进一步提高了最优性并同时保持DNN的通用可行性。我们应用预防性学习框架来开发Deepopf +,以解决网格运行中的基本DC最佳功率流量问题。它在确保在轻负载和重载制度中的可行性和获得一致的理想加速性能时,它可以改善现有的基于DNN的方案。仿真结果对IEEE案例-30 / 118/300测试用例显示DeepoPF +与最优性损失的最优损失和最高幅度计算加速度为100 \%$ 0.5%的可行解决方案,相比之下艺术迭代求解器。
translated by 谷歌翻译
Reliability Assessment Commitment (RAC) Optimization is increasingly important in grid operations due to larger shares of renewable generations in the generation mix and increased prediction errors. Independent System Operators (ISOs) also aim at using finer time granularities, longer time horizons, and possibly stochastic formulations for additional economic and reliability benefits. The goal of this paper is to address the computational challenges arising in extending the scope of RAC formulations. It presents RACLEARN that (1) uses Graph Neural Networks (GNN) to predict generator commitments and active line constraints, (2) associates a confidence value to each commitment prediction, (3) selects a subset of the high-confidence predictions, which are (4) repaired for feasibility, and (5) seeds a state-of-the-art optimization algorithm with the feasible predictions and the active constraints. Experimental results on exact RAC formulations used by the Midcontinent Independent System Operator (MISO) and an actual transmission network (8965 transmission lines, 6708 buses, 1890 generators, and 6262 load units) show that the RACLEARN framework can speed up RAC optimization by factors ranging from 2 to 4 with negligible loss in solution quality.
translated by 谷歌翻译
可再生能源世代的高百分比渗透对电力系统引起了重大不确定性。它要求网格操作员更频繁地解决替代电流最佳功率流(AC-OPF)问题,以便在传输和分配网格中进行经济和可靠的操作。在本文中,我们开发了一种Deep神经网络(DNN)方法,称为DEEPOPF,用于在传统求解器使用的时间中解决AC-OPF问题。应用机器学习技术解决AC-OPF问题的关键困难在于确保获得的解决方案尊重平等和不平等的物理和操作约束。在[1],[2]中概括了2阶段的过程,DEEPOPF首先训练DNN模型,以预测一组独立的操作变量,然后通过求解功率流方程直接计算剩余的可靠性变量。这种方法不仅保留了平衡平等的限制,而且还减少了DNN预测的变量数量,从而减少了所需的神经元和训练数据的数量。然后,DeePOPF在培训过程中采用零级梯度估计技术采用惩罚方法,以保留其余的不平等约束。作为另一个贡献,我们根据所需的近似精度来驱动调整DNN的大小的条件,该准确性测量了DNN的概括能力。它为使用DNN解决AC-OPF问题提供了理论上的理由。 IEEE 30/118/300-BU和合成2000总线测试用例的仿真结果表明,与最先进的求解器相比,DEEPOPF最多将计算时间速度高达两个数量级,费用为费用$ <$ <$ 0.1%的成本差异。
translated by 谷歌翻译
由于负载和可再生能源的不确定性日益增长,对现代电网的安全和最佳运行产生了突出的挑战。随机最佳功率流(SOPF)制剂提供了一种通过计算在不确定性下保持可行性的派遣决策和控制政策来处理这些不确定性的机制。大多数SOPF配方考虑了简单的控制策略,例如数学上简单的仿射策略,类似于当前实践中使用的许多策略。通过机器学习(ML)算法的功效和一般控制政策的潜在好处的效果,我们提出了一个深度神经网络(DNN)基础的政策,该政策是实时预测发电机调度决策的不确定。使用解决SOPF的随机原始双重更新来学习DNN的权重,而无需先前一代训练标签,并且可以明确地解释SOPF中的可行性约束。 DNN政策对更简单的政策和它们在执行安全限制和产生附近的近最佳解决方案中的功效的优点在于机会在许多测试用例上受到限制的制定的情况下。
translated by 谷歌翻译
非凸AC-OPF问题的多个负载分解映射的存在对深神经网络(DNN)方案构成了根本挑战。由于训练数据集可能包含与不同负载分解映射相对应的数据点的混合物,因此DNN可能无法学习合法的映射并生成劣质解决方案。我们建议DeepOpf-al作为解决此问题的增强学习方法。这个想法是训练DNN,以学习从增强输入(即(负载,初始点))的唯一映射到由具有负载和初始点作为进气口的迭代OPF求解器生成的解决方案。然后,我们将学习的增强映射应用于求解AC-OPF问题的速度要快得多。与最近的DNN方案相比,IEEE测试案例的模拟结果表明,DeepOPF-AL可以明显地取得更好的最优性和相似的可行性和加速性能,具有相同的DNN大小却提高了训练的复杂性。
translated by 谷歌翻译
本文介绍了一个框架,以捕获先前棘手的优化约束,并通过使用神经网络将其转换为混合构成线性程序。我们编码以可拖动和顽固的约束为特征的优化问题的可行空间,例如微分方程,转到神经网络。利用神经网络的精确混合重新印象,我们解决了混合企业线性程序,该程序将解决方案准确地近似于最初棘手的非线性优化问题。我们将方法应用于交流最佳功率流问题(AC-OPF),其中直接包含动态安全性约束可使AC-OPF棘手。我们提出的方法具有比传统方法更明显的可扩展性。我们展示了考虑N-1安全性和小信号稳定性的电力系统操作方法,展示了如何有效地获得成本优势的解决方案,同时满足静态和动态安全性约束。
translated by 谷歌翻译
到2035年,美国电力部门的转型正在进行中,以实现100%无碳污染的电力,以实现这一目标,同时保持安全可靠的电网,需要新的操作范式,以快速准确的决策来制定新的操作范式在动态和不确定的环境中。我们为动态网格重新配置(PHML-DYR)的决策提出了一个新颖的物理知识的机器学习框架,这是电源系统中的关键任务。动态重新配置(DYR)是一个动态设置开关状态的过程,从而导致最佳网格拓扑,从而最大程度地减少线路损耗。为了解决由于决策变量的混合性质而导致的NP硬度的潜在计算复杂性,我们建议使用物理信息信息的ML(PHML),该物理信息(PHML)将操作约束以及拓扑结构和连接性约束集成到神经网络框架中。我们的PHML方法学会同时优化网格拓扑和发电机调度,以满足负载,提高效率并保持在安全的操作范围内。我们证明了PHML-DYR在规范网格上的有效性,显示电力损耗的减少23%,并改善了电压曲线。我们还显示了使用PHML-DYR的数量级以及训练时间的约束违规行为的减少。
translated by 谷歌翻译
最佳功率流(OPF)是电力系统中的一个基本问题。它是计算的具有挑战性,最近的研究已经建议使用深神经网络(DNN)在与通过经典优化方法获得的那些相比时在大大降低的运行时找到OPF近似。虽然这些作品表明,令人鼓舞的准确性和运行时的结果,但对于为什么这些模型可以准确地预测OPF解决方案以及宽大的鲁棒性,而令人愉快的结果。本文提供了解决这种知识差距的前进。该纸张将发电机输出的波动性连接到学习模型近似对象的能力,它阐明了影响DNN模型的特征来学习良好的预测因子,并提出了一种利用此目的观察的新模型纸张生产精确且强大的opf预测。
translated by 谷歌翻译
在不确定性下,协调逆变器是用于集成可再生能源在配电网格中的缺点。除非频繁地呼吸折叠速度,否则控制逆变器给定近似网格条件或其代理成为一个关键规范。虽然深神经网络(DNN)可以学习最佳的逆变时间表,但保证可行性在很大程度上是难以捉摸的。而不是培训DNN以模仿已经计算的最佳功率流量(OPF)解决方案,而是将基于DNN的变频器策略集成到OPF中。所提出的DNN通过两个OPF替代方案培训,该替代方案限制了平均电压偏差,并且作为机会约束的凸起限制。训练有素的DNN可以由当前网格条件的部分,嘈杂或代理描述符驱动。当OPF必须为不可观察的馈线解决OPF而言,这很重要。假设网络模型是已知的,通过反向传播训练,并且在区分AC电流方程时训练。否则,提出了一种梯度的变体。后者当逆变器由具有仅访问电源流求解器或馈线的数字双胞胎的访问的聚合器控制时相关。数值测试将基于DNN的变频器控制方案与最佳逆变器设定值的优化和可行性进行比较。
translated by 谷歌翻译
Machine learning (ML) algorithms are remarkably good at approximating complex non-linear relationships. Most ML training processes, however, are designed to deliver ML tools with good average performance, but do not offer any guarantees about their worst-case estimation error. For safety-critical systems such as power systems, this places a major barrier for their adoption. So far, approaches could determine the worst-case violations of only trained ML algorithms. To the best of our knowledge, this is the first paper to introduce a neural network training procedure designed to achieve both a good average performance and minimum worst-case violations. Using the Optimal Power Flow (OPF) problem as a guiding application, our approach (i) introduces a framework that reduces the worst-case generation constraint violations during training, incorporating them as a differentiable optimization layer; and (ii) presents a neural network sequential learning architecture to significantly accelerate it. We demonstrate the proposed architecture on four different test systems ranging from 39 buses to 162 buses, for both AC-OPF and DC-OPF applications.
translated by 谷歌翻译
本文介绍了OptNet,该网络架构集成了优化问题(这里,专门以二次程序的形式),作为较大端到端可训练的深网络中的单个层。这些层在隐藏状态之间编码约束和复杂依赖性,传统的卷积和完全连接的层通常无法捕获。我们探索这种架构的基础:我们展示了如何使用敏感性分析,彼得优化和隐式差分的技术如何通过这些层和相对于层参数精确地区分;我们为这些层开发了一种高效的解算器,用于利用基于GPU的基于GPU的批处理在原始 - 双内部点法中解决,并且在求解的顶部几乎没有额外的成本提供了反向衰减梯度;我们突出了这些方法在几个问题中的应用。在一个值得注意的示例中,该方法学习仅在输入和输出游戏中播放Mini-sudoku(4x4),没有关于游戏规则的a-priori信息;这突出了OptNet比其他神经架构更好地学习硬限制的能力。
translated by 谷歌翻译
我们开发了快速算法和可靠软件,以凸出具有Relu激活功能的两层神经网络的凸优化。我们的工作利用了标准的重量罚款训练问题作为一组组-YELL_1 $调查的数据本地模型的凸重新印度,其中局部由多面体锥体约束强制执行。在零规范化的特殊情况下,我们表明此问题完全等同于凸“ Gated Relu”网络的不受约束的优化。对于非零正则化的问题,我们表明凸面式relu模型获得了RELU训练问题的数据依赖性近似范围。为了优化凸的重新制定,我们开发了一种加速的近端梯度方法和实用的增强拉格朗日求解器。我们表明,这些方法比针对非凸问题(例如SGD)和超越商业内部点求解器的标准训练启发式方法要快。在实验上,我们验证了我们的理论结果,探索组-ELL_1 $正则化路径,并对神经网络进行比例凸的优化,以在MNIST和CIFAR-10上进行图像分类。
translated by 谷歌翻译
我们考虑非线性优化问题,涉及神经网络代表代理模型。我们首先展示了如何直接将神经网络评估嵌入优化模型中,突出难以防止收敛的方法,然后表征这些模型的平稳性。然后,我们在具有Relu激活的前馈神经网络的特定情况下存在两种替代配方,其具有recu激活:作为混合整数优化问题,作为具有互补限制的数学程序。对于后一种制剂,我们证明了在该问题的点处的有同性,对应于嵌入式制剂的实质性。这些配方中的每一个都可以用最先进的优化方法来解决,并且我们展示了如何为这些方法获得良好的初始可行解决方案。我们将三种实际应用的配方进行比较,在燃烧发动机的设计和控制中产生的三种实际应用,在对分类器网络的对抗攻击中产生的产生,以及在油井网中的最佳流动确定。
translated by 谷歌翻译
组合优化是运营研究和计算机科学领域的一个公认领域。直到最近,它的方法一直集中在孤立地解决问题实例,而忽略了它们通常源于实践中的相关数据分布。但是,近年来,人们对使用机器学习,尤其是图形神经网络(GNN)的兴趣激增,作为组合任务的关键构件,直接作为求解器或通过增强确切的求解器。GNN的电感偏差有效地编码了组合和关系输入,因为它们对排列和对输入稀疏性的意识的不变性。本文介绍了对这个新兴领域的最新主要进步的概念回顾,旨在优化和机器学习研究人员。
translated by 谷歌翻译
最小的平方和群集(MSSC)或K-Means型聚类,传统上被认为是无监督的学习任务。近年来,使用背景知识来提高集群质量,促进聚类过程的可解释性已成为数学优化和机器学习研究的热门研究课题。利用数据群集中的背景信息的问题称为半监督或约束群集。在本文中,我们为半监控MSSC提供了一种新的分支和绑定算法,其中背景知识被包含为成对必须 - 链接和无法链接约束。对于较低的界限,我们解决了MSSC离散优化模型的Semidefinite编程宽松,并使用了用于加强界限的纤维平面程序。相反,通过使用整数编程工具,我们提出了将K-Means算法适应受约束的情况。这是第一次,所提出的全局优化算法有效地管理,以解决现实世界的情况,最高可达800个数据点,具有必要的必须 - 链接和无法链接约束以及通用数量的功能。这个问题大小大约比最先进的精确算法解决的实例大约四倍。
translated by 谷歌翻译
预订控制问题是收入管理领域中发生的顺序决策问题。更确切地说,货运预订控制重点是决定接受或拒绝预订的问题:鉴于有限的能力,接受预订请求或拒绝其保留能力,以预订可能更高收入的未来预订。该问题可以作为有限的摩尼斯随机动态程序提出,其中接受一组请求会在预订期结束时获得利润,取决于履行公认的预订的成本。对于许多货运申请,可以通过解决操作决策问题来获得满足请求的成本,该问题通常需要解决混合组织线性计划的解决方案。在部署强化学习算法时,通常会常规地解决此类操作问题,这可能太耗时了。大多数预订控制策略是通过解决特定问题的数学编程松弛来获得的,这些松弛通常是不宽松的,无法推广到新问题,并且在某些情况下提供了相当粗糙的近似值。在这项工作中,我们提出了一种两阶段的方法:我们首先训练一个监督的学习模型来预测操作问题的目标,然后我们将模型部署在加固学习算法中以计算控制政策。这种方法是一般的:每当可以预测Horizo​​n操作问题的目标函数时,都可以使用它,并且特别适合那些此类问题在计算上很难的情况。此外,它允许人们利用加强学习的最新进展,因为常规解决操作问题被单个预测所取代。我们的方法对文献中的两个预订控制问题进行了评估,即分销物流和航空公司货物管理。
translated by 谷歌翻译
本文考虑了最佳功率流(OPF)的优化代理,即近似于OPF的输入/输出关系的机器学习模型。最近的工作重点是表明此类代理可能具有高忠诚。但是,他们的培训需要大量数据,每个实例都需要(离线)解决输入分布样本的OPF。为了满足市场清除应用程序的要求,本文提出了积极的桶装采样(ABS),这是一个新型的活跃学习框架,旨在培训在一个时间限制内培训最佳OPF代理。ABS将输入分布分配到存储桶中,并使用采集函数来确定接下来的何处。它依靠自适应学习率,随着时间的推移会增加和降低。实验结果证明了ABS的好处。
translated by 谷歌翻译