离散的Hahn多项式(DHP)及其时刻被认为是高效的正交矩之一,并且它们应用于各种科学领域,例如图像处理和特征提取。通常,DHP用作对象表示;然而,当瞬间顺序变大时,它们遭受数值不稳定性的问题。在本文中,提出了一种用于计算HAHN正交基础的有效方法,并应用于高订单。本文开发了一种用于计算DHP初始值的新数学模型,以及用于DHP参数的不同值($ \ alpha $和$ \ beta $)。另外,所提出的方法由两个复发算法组成,具有自适应阈值,以稳定DHP系数的产生。它与在计算成本和可以正确生成的最大尺寸方面与最先进的算法进行比较。实验结果表明,该算法在($ \ alpha $和$ \ beta $)和多项式大小的宽范围范围内的参数中表现更好。
translated by 谷歌翻译
图像表示是计算机视觉和模式识别中的一个重要主题。它在一系列应用中扮演了了解视觉内容的基本作用。据报道,基于矩的图像表示在满足其由于其有益的数学特性而满足语义描述的核心条件,特别是几何不变性和独立性。本文介绍了对图像表示的正交矩的全面调查,涵盖了快速/准确计算,鲁棒性/不变性优化,定义扩展和应用程序的最新进步。我们还为各种广泛使用的正交瞬间创建一个软件包,并在同一基地中评估此类方法。提出的理论分析,软件实施和评估结果可以支持社区,特别是在开发新颖的技术和促进现实世界的应用方面。
translated by 谷歌翻译
在过去十年中,图像已成为许多域中的重要信息来源,因此他们的高质量是获取更好信息的必要条件。出现的重要问题是图像去噪,这意味着从不准确和/或部分测量的样品中恢复信号。这种解释与压缩感测理论高度相关,这是一种革命性的技术,并且意味着如果信号稀疏,则可以从几个测量值获得原始信号,这些值远低于其他使用的理论所建议的值像Shannon的抽样理论。压缩传感(CS)理论的强因素以实现稀疏性解决方案以及从损坏的图像中移除的噪声是基础词典的选择。在本文中,比较了基于压缩感测和稀疏近似理论的高斯粘性白噪声的离散余弦变换(DCT)和力矩变换(TCHEBICHEF,KRAWTCHOUK)。实验结果表明,由矩变换构建的基本词典竞争性地表现为传统的DCT。后一种变换显示了30.82dB的PSNR,与Tchebichef变换相同的0.91 SSIM值。此外,从稀疏性的角度来看,Krawtchouk时刻提供大约20-30%的稀疏结果比DCT更多。
translated by 谷歌翻译
随着数据采集技术的发展,在许多领域收集并广泛使用多通道数据。其中大多数可以表示为各种类型的矢量功能。用于识别某些感兴趣模式的传染媒介功能的特征提取是一个关键但具有挑战性的任务。在本文中,我们专注于构建一般矢量功能的时刻不变。具体地,我们定义旋转仿射变换以描述一般矢量功能的真实变形,然后设计一个结构框,以系统地生成对该变换模型的不变性的高斯 - 海密力矩。这是在文献中提出了统一帧的第一次,以构建一般矢量功能的正交时刻不变。鉴于某种类型的多通道数据,我们演示了如何利用新方法来派生所有可能的不变性并消除它们之间的各种依赖性。对于RGB图像,2D和3D流字段,我们获得了具有低订单和低度的不变性的完整和独立集。基于综合性和流行的矢量值数据集,进行了实验,以评估这些不变量的稳定性和可辨别性,以及它们对噪声的鲁棒性。结果清楚地表明,我们撰写文件中提出的那一刻不变性的性能比其他以前使用的时刻在RGB图像分类中的传染媒介函数中的不变性,2D矢量字段中的涡旋检测和3D流场匹配的模板匹配。
translated by 谷歌翻译
图像取证是一个上升的话题,因为值得信赖的多媒体内容对于现代社会至关重要。像其他与视觉相关的应用一样,法医分析在很大程度上依赖于适当的图像表示。尽管很重要,但目前对这种表示的理论理解仍然有限,其关键作用的忽视程度不同。对于这个差距,我们试图从理论,实施和应用的角度研究以法医为导向的图像表示作为一个独特的问题。我们的工作始于基本原则的抽象,法医的表示应该满足,尤其是揭示了鲁棒性,可解释性和覆盖范围的关键性。在理论层面上,我们为取证的新表示框架提出了一个称为密​​集不变表示(dir)的新表示框架,该框架的特征是具有数学保证的稳定描述。在实现级别上,讨论了DIR的离散计算问题,并设计相应的准确和快速解决方案具有通用性质和恒定的复杂性。我们在密集域模式检测和匹配实验上演示了上述论点,从而提供了与最新描述符的比较结果。此外,在应用程序级别上,提出的DIR最初是在被动和主动取证中探索的,即复制移动伪造的检测和感知散列,在满足此类法医任务的要求方面表现出了好处。
translated by 谷歌翻译
我们提出了一种快速且数值准确的方法,用于扩展数字化的$ l \ times l $图像,代表$ [-1,1]^2 $在磁盘$ \ {x \ in \ in \ mathbb {r}^2:| |磁盘上的谐波(dirichlet laplacian eigenfunctions)中的x | <1 \} $。我们的方法以$ \ Mathcal {O}(l^2 \ log L)$操作运行。此基础也称为傅立叶贝塞尔基础,它具有多个计算优势:它是正交的,按频率订购,并且可以通过将对角线变换应用于系数来旋转,从而可以旋转图像。此外,我们表明,具有径向函数的卷积也可以通过将对角变换应用于系数进行有效计算。
translated by 谷歌翻译
替代模型用于减轻工程任务中的计算负担,这些计算负担需要重复评估计算要求的物理系统模型,例如不确定性的有效传播。对于显示出非常非线性依赖其输入参数的模型,标准的替代技术(例如多项式混沌膨胀)不足以获得原始模型响应的准确表示。通过应用有理近似,对于通过有理函数准确描述的模型可以有效地降低近似误差。具体而言,我们的目标是近似复杂值模型。获得替代系数的一种常见方法是最小化模型和替代物之间的基于样本的误差,从最小二乘意义上讲。为了获得原始模型的准确表示并避免过度拟合,样品集的量是扩展中多项式项数的两到三倍。对于需要高多项式程度或在其输入参数方面具有高维度的模型,该数字通常超过负担得起的计算成本。为了克服这个问题,我们将稀疏的贝叶斯学习方法应用于理性近似。通过特定的先前分布结构,在替代模型的系数中诱导稀疏性。分母的多项式系数以及问题的超参数是通过类型-II-Maximim-Maximim类似方法来确定的。我们应用了准牛顿梯度散发算法,以找到最佳的分母系数,并通过应用$ \ mathbb {cr} $ -Colculus来得出所需的梯度。
translated by 谷歌翻译
Low-rank matrix approximations, such as the truncated singular value decomposition and the rank-revealing QR decomposition, play a central role in data analysis and scientific computing. This work surveys and extends recent research which demonstrates that randomization offers a powerful tool for performing low-rank matrix approximation. These techniques exploit modern computational architectures more fully than classical methods and open the possibility of dealing with truly massive data sets.This paper presents a modular framework for constructing randomized algorithms that compute partial matrix decompositions. These methods use random sampling to identify a subspace that captures most of the action of a matrix. The input matrix is then compressed-either explicitly or implicitly-to this subspace, and the reduced matrix is manipulated deterministically to obtain the desired low-rank factorization. In many cases, this approach beats its classical competitors in terms of accuracy, speed, and robustness. These claims are supported by extensive numerical experiments and a detailed error analysis.The specific benefits of randomized techniques depend on the computational environment. Consider the model problem of finding the k dominant components of the singular value decomposition of an m × n matrix. (i) For a dense input matrix, randomized algorithms require O(mn log(k)) floating-point operations (flops) in contrast with O(mnk) for classical algorithms. (ii) For a sparse input matrix, the flop count matches classical Krylov subspace methods, but the randomized approach is more robust and can easily be reorganized to exploit multi-processor architectures. (iii) For a matrix that is too large to fit in fast memory, the randomized techniques require only a constant number of passes over the data, as opposed to O(k) passes for classical algorithms. In fact, it is sometimes possible to perform matrix approximation with a single pass over the data.
translated by 谷歌翻译
神经网络的可解释性及其潜在的理论行为仍然是一个开放的学习领域,即使在实际应用的巨大成功之后,特别是在深度学习的出现。在这项工作中,提出了NN2Poly:一种理论方法,允许获得提供已经训练的深神经网络的替代表示的多项式。这扩展了ARXIV中提出的先前想法:2102.03865,其仅限于单个隐藏层神经网络,以便在回归和分类任务中使用任意深度前馈神经网络。本文的目的是通过在每层的激活函数上使用泰勒膨胀来实现,然后使用若干组合性质,允许识别所需多项式的系数。讨论了实现本理论方法时的主要计算限制,并介绍了NN2POLY工作所必需的神经网络权重的约束的示例。最后,呈现了一些模拟,得出结论,使用NN2Poly可以获得给定神经网络的表示,并且在所获得的预测之间具有低误差。
translated by 谷歌翻译
我们为函数开发启发式插值方法$ t \ mapsto \ log \ det \ left(\ mathbf {a} + t \ t \ mathbf {b} \ right)$和$ t \ mapsto \ mapsto \ operatatorNAME {trace}Mathbf {a} + t \ mathbf {b})^{p} \ right)$,其中矩阵$ \ mathbf {a} $ and $ \ mathbf {b} $是Hermitian and Hermitian and阳性(semi)和$ P $$ t $是实际变量。这些功能在统计,机器学习和计算物理学的许多应用中都有特征。提出的插值函数基于对这些函数的尖锐边界的修改。我们通过数值示例证明了所提出的方法的准确性和性能,即高斯过程回归的边际最大似然估计以及用广义交叉验证方法对脊回归的正则参数的估计。
translated by 谷歌翻译
我们提出了一种新的图像缩放方法,既用于缩小和放大尺寸,都以任何比例因子或所需的大小运行。调整大小的图像是通过对全球范围内的双变量多项式进行采样来实现的。该方法的特殊性在于我们使用的采样模型和插值多项式。我们考虑了基于第一类Chebyshev零的不寻常的采样系统,而不是经典的统一网格。这种节点的最佳分布允许考虑由de la vall \'ee poussin型过滤器定义的接近最佳的插值多项​​式。该过滤器的动作射线提供了一个附加参数,可以适当调节以改善近似值。该方法已在大量不同的图像数据集上进行了测试。结果以定性和定量术语进行评估,并与其他可用竞争方法进行比较。所得缩放图像的感知质量使得保留了重要的细节,并且伪像的外观很低。竞争性质量测量值,良好的视觉质量,有限的计算工作和中等记忆需求使该方法适合现实世界应用。
translated by 谷歌翻译
我们开发了一个计算程序,以估计具有附加噪声的半摩托车高斯过程回归模型的协方差超参数。也就是说,提出的方法可用于有效估计相关误差的方差,以及基于最大化边际似然函数的噪声方差。我们的方法涉及适当地降低超参数空间的维度,以简化单变量的根发现问题的估计过程。此外,我们得出了边际似然函数及其衍生物的边界和渐近线,这对于缩小高参数搜索的初始范围很有用。使用数值示例,我们证明了与传统参数优化相比,提出方法的计算优势和鲁棒性。
translated by 谷歌翻译
我们介绍了一种确定全局特征解耦的方法,并显示其适用于提高数据分析性能的适用性,并开放了新的场所以进行功能传输。我们提出了一种新的形式主义,该形式主义是基于沿特征梯度遵循轨迹来定义对子曼群的转换的。通过这些转换,我们定义了一个归一化,我们证明,它允许解耦可区分的特征。通过将其应用于采样矩,我们获得了用于正骨的准分析溶液,正尾肌肉是峰度的归一化版本,不仅与平均值和方差相关,而且还与偏度相关。我们将此方法应用于原始数据域和过滤器库的输出中,以基于全局描述符的回归和分类问题,与使用经典(未删除)描述符相比,性能得到一致且显着的改进。
translated by 谷歌翻译
多项式扩张对于神经网络非线性的分析很重要。他们已应用于验证,解释性和安全性的众所周知的困难。现有方法跨度古典泰勒和切苯齐夫方法,渐近学和许多数值方法。我们发现,虽然这些单独具有有用的属性,如确切的错误公式,可调域和鲁棒性对未定义的衍生物,但没有提供一致方法,其具有所有这些属性的扩展。为解决此问题,我们开发了一个分析修改的积分变换扩展(AMITE),通过使用派生标准进行修改的整体变换的新型扩展。我们展示了一般的扩展,然后展示了两个流行的激活功能,双曲线切线和整流线性单位的应用。与本端使用的现有扩展(即Chebyshev,Taylor和Numerical)相比,Amite是第一个提供六个以前相互排斥的膨胀性能,例如系数的精确公式和精确的膨胀误差(表II)。我们展示了两种案例研究中Amite的有效性。首先,多变量多项式形式从单个隐藏层黑盒子多层Perceptron(MLP)有效地提取,以促进从嘈杂的刺激响应对的等效测试。其次,在3到7层之间的各种前馈神经网络(FFNN)架构是使用由Amite多项式和误差公式改善的泰勒模型的范围。 Amite呈现了一种新的扩展方法维度,适用于神经网络中的非线性的分析/近似,打开新的方向和机会,了解神经网络的理论分析和系统测试。
translated by 谷歌翻译
We propose a novel method for constructing wavelet transforms of functions defined on the vertices of an arbitrary finite weighted graph. Our approach is based on defining scaling using the the graph analogue of the Fourier domain, namely the spectral decomposition of the discrete graph Laplacian L. Given a wavelet generating kernel g and a scale parameter t, we define the scaled wavelet operator T t g = g(tL). The spectral graph wavelets are then formed by localizing this operator by applying it to an indicator function. Subject to an admissibility condition on g, this procedure defines an invertible transform. We explore the localization properties of the wavelets in the limit of fine scales. Additionally, we present a fast Chebyshev polynomial approximation algorithm for computing the transform that avoids the need for diagonalizing L. We highlight potential applications of the transform through examples of wavelets on graphs corresponding to a variety of different problem domains.
translated by 谷歌翻译
本文涉及使用多项式的有限样品的平滑,高维函数的近似。这项任务是计算科学和工程中许多应用的核心 - 尤其是由参数建模和不确定性量化引起的。通常在此类应用中使用蒙特卡洛(MC)采样,以免屈服于维度的诅咒。但是,众所周知,这种策略在理论上是最佳的。尺寸$ n $有许多多项式空间,样品复杂度尺度划分为$ n $。这种有据可查的现象导致了一致的努力,以设计改进的,实际上是近乎最佳的策略,其样本复杂性是线性的,甚至线性地缩小了$ n $。自相矛盾的是,在这项工作中,我们表明MC实际上是高维度中的一个非常好的策略。我们首先通过几个数值示例记录了这种现象。接下来,我们提出一个理论分析,该分析能够解决这种悖论,以实现无限多变量的全体形态功能。我们表明,基于$ M $ MC样本的最小二乘方案,其错误衰减为$ m/\ log(m)$,其速率与最佳$ n $ term的速率相同多项式近似。该结果是非构造性的,因为它假定了进行近似的合适多项式空间的知识。接下来,我们提出了一个基于压缩感应的方案,该方案达到了相同的速率,除了较大的聚类因子。该方案是实用的,并且在数值上,它的性能和比知名的自适应最小二乘方案的性能和更好。总体而言,我们的发现表明,当尺寸足够高时,MC采样非常适合平滑功能近似。因此,改进的采样策略的好处通常仅限于较低维度的设置。
translated by 谷歌翻译
Koopman运算符是无限维的运算符,可全球线性化非线性动态系统,使其光谱信息可用于理解动态。然而,Koopman运算符可以具有连续的光谱和无限维度的子空间,使得它们的光谱信息提供相当大的挑战。本文介绍了具有严格融合的数据驱动算法,用于从轨迹数据计算Koopman运算符的频谱信息。我们引入了残余动态模式分解(ResDMD),它提供了第一种用于计算普通Koopman运算符的Spectra和PseudtoStra的第一种方案,无需光谱污染。使用解析器操作员和RESDMD,我们还计算与测量保存动态系统相关的光谱度量的平滑近似。我们证明了我们的算法的显式收敛定理,即使计算连续频谱和离散频谱的密度,也可以实现高阶收敛即使是混沌系统。我们展示了在帐篷地图,高斯迭代地图,非线性摆,双摆,洛伦茨系统和11美元延长洛伦兹系统的算法。最后,我们为具有高维状态空间的动态系统提供了我们的算法的核化变体。这使我们能够计算与具有20,046维状态空间的蛋白质分子的动态相关的光谱度量,并计算出湍流流过空气的误差界限的非线性Koopman模式,其具有雷诺数为$> 10 ^ 5 $。一个295,122维的状态空间。
translated by 谷歌翻译
我们开发了一种多尺度方法,以从实验或模拟中观察到的物理字段或配置的数据集估算高维概率分布。通过这种方式,我们可以估计能量功能(或哈密顿量),并有效地在从统计物理学到宇宙学的各个领域中生成多体系统的新样本。我们的方法 - 小波条件重新归一化组(WC-RG) - 按比例进行估算,以估算由粗粒磁场来调节的“快速自由度”的条件概率的模型。这些概率分布是由与比例相互作用相关的能量函数建模的,并以正交小波为基础表示。 WC-RG将微观能量函数分解为各个尺度上的相互作用能量之和,并可以通过从粗尺度到细度来有效地生成新样品。近相变,它避免了直接估计和采样算法的“临界减速”。理论上通过结合RG和小波理论的结果来解释这一点,并为高斯和$ \ varphi^4 $字段理论进行数值验证。我们表明,多尺度WC-RG基于能量的模型比局部电位模型更通用,并且可以在所有长度尺度上捕获复杂的多体相互作用系统的物理。这是针对反映宇宙学中暗物质分布的弱透镜镜头的,其中包括与长尾概率分布的长距离相互作用。 WC-RG在非平衡系统中具有大量的潜在应用,其中未知基础分布{\ it先验}。最后,我们讨论了WC-RG和深层网络体系结构之间的联系。
translated by 谷歌翻译
This paper presents a surrogate modelling technique based on domain partitioning for Bayesian parameter inference of highly nonlinear engineering models. In order to alleviate the computational burden typically involved in Bayesian inference applications, a multielement Polynomial Chaos Expansion based Kriging metamodel is proposed. The developed surrogate model combines in a piecewise function an array of local Polynomial Chaos based Kriging metamodels constructed on a finite set of non-overlapping subdomains of the stochastic input space. Therewith, the presence of non-smoothness in the response of the forward model (e.g.~ nonlinearities and sparseness) can be reproduced by the proposed metamodel with minimum computational costs owing to its local adaptation capabilities. The model parameter inference is conducted through a Markov chain Monte Carlo approach comprising adaptive exploration and delayed rejection. The efficiency and accuracy of the proposed approach are validated through two case studies, including an analytical benchmark and a numerical case study. The latter relates the partial differential equation governing the hydrogen diffusion phenomenon of metallic materials in Thermal Desorption Spectroscopy tests.
translated by 谷歌翻译
在这项工作中,我们解决了从$ \ epsilon $ -corrupted样本的$ k $组件稳健地学习高斯高斯混合模型的问题,以准确率$ \ widetilde {o}(\ epsilon)在总变化距离中持续$ k $,并在混合物上具有温和的假设。这种稳健性保证是最佳的积极因素因素。主要挑战是,大多数早期的作品依赖于在混合中学习各个组件,但在我们的环境中是不可能的,至少对于我们旨在保证的强大稳健性的类型是不可能的。相反,我们介绍了一个新的框架,我们称之为{\ em强烈的可观察性},这为我们提供了一条规避这障碍的途径。
translated by 谷歌翻译