智能论文笔记

Improved Point Estimation for the Rayleigh Regression Model

B. G. Palm , F. M. Bayer , R. J. Cintra

分类：计算机视觉

2022-08-07

最近提出了瑞利回归模型，用于建模合成孔径雷达（SAR）图像像素的振幅值。但是，此类模型的推论基于最大似然估计器，这可能会对较小的信号长度产生偏差。SAR图像的瑞利回归模型通常会考虑到小像素窗口，这可能导致结果不准确。在这封信中，我们介绍了基于以下方面的瑞利回归模型量身定制的偏置调整的估计器；（i）Cox和Snell的方法；（ii）FIRTH的计划；（iii）参数引导法。我们提出了考虑合成和实际SAR数据集的数值实验。偏置调整后的估计器产生几乎公正的估计和准确的建模结果。

translated by 谷歌翻译

Robust Rayleigh Regression Method for SAR Image Processing in Presence of Outliers

B. G. Palm , F. M. Bayer , R. Machado , M. I. Pettersson , V. T. Vu , R. J. Cintra

分类：机器学习

2022-07-29

合成孔径雷达（SAR）数据中的异常值（异常值）的存在以及统计图像模型中的错误指定可能导致推断不准确。为了避免此类问题，提出了基于强大的估计过程的瑞利回归模型，作为模拟此类数据的更现实的方法。本文旨在获得瑞利回归模型参数估计量与异常值的存在。提出的方法考虑了加权最大似然法，并使用模拟和测量的SAR图像提交了数值实验。使用蒙特卡洛模拟来评估有限信号长度中提出的可靠估计器性能，对离群值的敏感性和分解点。例如，非稳定估计器显示相对偏置值$ 65 $ - 折叠比损坏信号中强大方法提供的结果大。在灵敏度分析和分解点方面，强大的方案在两种措施的平均绝对值中分别降低了约96美元\％$和$ 10 \％$，以同情非稳定估计器。此外，使用两个SAR数据集比较了所提出的强稳定方案的地面类型和异常检测结果与文献中的竞争方法。

translated by 谷歌翻译

Prediction Intervals in the Beta Autoregressive Moving Average Model

B. G. Palm , F. M. Bayer , R. J. Cintra

分类：机器学习

2022-07-24

在本文中，我们提出了Beta自回归移动平均模型的五个预测间隔。该模型适用于在间隔$（0,1）$中假设值的建模和预测变量。提出的两个预测间隔是基于近似值，考虑到β分布的正态分布和分位功能。我们还考虑基于自举的预测间隔，即：（i）自举预测错误（BPE）间隔；（ii）偏置校正和加速度（BCA）预测间隔；（iii）基于两种不同的自举计划的引导程序预测值的分位数的百分位预测间隔。根据蒙特卡洛模拟评估了提出的预测间隔。 BCA预测间隔在评估的间隔中提供了最佳性能，显示出较低的覆盖率失真和较小的平均长度。我们应用了我们的方法来预测巴西S \ ao Paulo的Cantareira供水系统的水位。

translated by 谷歌翻译

A Correlation-Ratio Transfer Learning and Variational Stein's Paradox

Lu Lin , Weiyu Li

分类： (统计)机器学习 | 机器学习

2022-06-10

有效传输学习的基本条件是目标模型和源模型之间的相似性。但是，实际上，相似条件很难满足甚至违反。本文引入了一种崭新的策略，即线性相关比率，而不是相似性条件，以建立模型之间的准确关系。这种相关比率可以通过历史数据或样本的一部分轻松估算。然后，基于相关比率组合建立了相关比率传递学习可能性。在实际方面，新框架应用于某些应用程序方案，尤其是数据流和医学研究领域。从方法上讲，建议将信息从简单的源模型传输到相对复杂的目标模型。从理论上讲，即使在源模型与目标模型不同的情况下，也可以达到一些有利的属性，包括全局收敛速率。总而言之，可以从理论和实验结果中可以看出，从相似或相似的源模型中的信息显着改善了目标模型的推断。换句话说，在转移学习的背景下说明了变异的Stein的悖论。

translated by 谷歌翻译

Variable selection via nonconcave penalized likelihood and its oracle properties

分类：

Your use of the JSTOR archive indicates your acceptance of JSTOR's Terms and Conditions of Use, available at http://www.jstor.org/page/info/about/policies/terms.jsp. JSTOR's Terms and Conditions of Use provides, in part, that unless you have obtained prior permission, you may not download an entire issue of a journal or multiple copies of articles, and you may use content in the JSTOR archive only for your personal, non-commercial use.Please contact the publisher regarding any further use of this work. Publisher contact information may be obtained at http://www.jstor.org/action/showPublisher?publisherCode=astata.Each copy of any part of a JSTOR transmission must contain the same copyright notice that appears on the screen or printed page of such transmission. JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms of scholarship. For more information about JSTOR, please contact

translated by 谷歌翻译

Efficient Estimation in NPIV Models: A Comparison of Various Neural Networks-Based Estimators

Jiafeng Chen , Xiaohong Chen , Elie Tamer

分类：机器学习

2021-10-13

人工神经网络（ANNS）可以被视为非线性筛子，其可以比线性筛更有效地近似高维变量的复杂功能。我们调查与经验经济学相关的中等高维协变量的非参数仪器变量（NPIV）模型的各种ANN的计算性能。我们在加权平均衍生物（WAD）上介绍了两个有效的估计和推断方法：具有最佳加权筛分最小距离（OP-OSMD）程序的正交化插件和筛分有效评分。 WAD的两个估计器都使用ANN筛来近似未知的NPIV功能，并且是根 - N渐近正常和一流的等价物。我们提供详细的从业者的配方，以实现有效的程序。这涉及选择未知NPIV的调整参数，包括在两个过程中存在的条件期望和最佳加权函数，而且还可以选择ES过程中未知RIESZ代表的调谐参数。我们比较各种仿真设计的有限样本性能，涉及涉及最多13个连续协变量，不同的非线性和协变量相关的NPIV功能。一些蒙特卡罗调查结果包括：1）调谐和优化在ANN估计中更精细; 2）给定适当调整，有各种架构的ANN估计都可以表现良好; 3）更容易调整ANN-OSMD估计比ANN EAN估算值; 4）用ANN（比样条曲线）估计变得稳定的推论更难以实现; 5）当前实现和近似理论之间存在间隙。最后，我们应用ANN NPIV以多变量协变者在两个经验需求示例中估算平均部分衍生物。

translated by 谷歌翻译

Adaptive LASSO estimation for functional hidden dynamic geostatistical model

Paolo Maranzano , Philipp Otto , Alessandro Fassò

分类： (统计)机器学习

2022-08-10

我们根据功能性隐藏动态地理模型（F-HDGM）的惩罚最大似然估计器（PMLE）提出了一种新型的模型选择算法。这些模型采用经典的混合效应回归结构，该结构具有嵌入式时空动力学，以模拟在功能域中观察到的地理参考数据。因此，感兴趣的参数是该域之间的函数。该算法同时选择了相关的样条基函数和回归变量，这些函数和回归变量用于对响应变量与协变量之间的固定效应关系进行建模。这样，它会自动收缩到功能系数的零部分或无关回归器的全部效果。该算法基于迭代优化，并使用自适应的绝对收缩和选择器操作员（LASSO）惩罚函数，其中未含量的F-HDGM最大likikelihood估计器获得了其中的权重。最大化的计算负担大大减少了可能性的局部二次近似。通过蒙特卡洛模拟研究，我们分析了在不同情况下算法的性能，包括回归器之间的强相关性。我们表明，在我们考虑的所有情况下，受罚的估计器的表现都优于未确定的估计器。我们将该算法应用于一个真实案例研究，其中将意大利伦巴第地区的小时二氧化氮浓度记录记录为具有多种天气和土地覆盖协变量的功能过程。

translated by 谷歌翻译

Prediction Errors for Penalized Regressions based on Generalized Approximate Message Passing

Ayaka Sakata

分类： (统计)机器学习 | 机器学习

2022-06-26

We discuss the prediction accuracy of assumed statistical models in terms of prediction errors for the generalized linear model and penalized maximum likelihood methods. We derive the forms of estimators for the prediction errors: C p criterion, information criteria, and leave-one-out cross validation (LOOCV) error, using the generalized approximate message passing (GAMP) algorithm and replica method. These estimators coincide with each other when the number of model parameters is sufficiently small; however, there is a discrepancy between them in particular in the overparametrized region where the number of model parameters is larger than the data dimension. In this paper, we review the prediction errors and corresponding estimators, and discuss their differences. In the framework of GAMP, we show that the information criteria can be expressed by using the variance of the estimates. Further, we demonstrate how to approach LOOCV error from the information criteria by utilizing the expression provided by GAMP.

translated by 谷歌翻译

Inference of Nonlinear Partial Differential Equations via Constrained Gaussian Processes

Zhaohui Li , Shihao Yang , Jeff Wu

分类： (统计)机器学习

2022-12-22

Partial differential equations (PDEs) are widely used for description of physical and engineering phenomena. Some key parameters involved in PDEs, which represents certain physical properties with important scientific interpretations, are difficult or even impossible to be measured directly. Estimation of these parameters from noisy and sparse experimental data of related physical quantities is an important task. Many methods for PDE parameter inference involve a large number of evaluations of numerical solution of PDE through algorithms such as finite element method, which can be time-consuming especially for nonlinear PDEs. In this paper, we propose a novel method for estimating unknown parameters in PDEs, called PDE-Informed Gaussian Process Inference (PIGPI). Through modeling the PDE solution as a Gaussian process (GP), we derive the manifold constraints induced by the (linear) PDE structure such that under the constraints, the GP satisfies the PDE. For nonlinear PDEs, we propose an augmentation method that transfers the nonlinear PDE into an equivalent PDE system linear in all derivatives that our PIGPI can handle. PIGPI can be applied to multi-dimensional PDE systems and PDE systems with unobserved components. The method completely bypasses the numerical solver for PDE, thus achieving drastic savings in computation time, especially for nonlinear PDEs. Moreover, the PIGPI method can give the uncertainty quantification for both the unknown parameters and the PDE solution. The proposed method is demonstrated by several application examples from different areas.

translated by 谷歌翻译

Correcting the Laplace Method with Variational Bayes

Janet van Niekerk , Haavard Rue

分类：机器学习 | (统计)机器学习

2021-11-25

当由于模型的复杂性或数据丰富而不是可行的，LAPPAlt方法，LAPPAlt近似和变分方法等近似推断方法是流行的方法。在本文中，我们提出了一种混合近似方法，即低秩变分贝叶斯校正（VBC），其使用LAPLACE方法并随后对后轴进行变分贝叶斯校正。这项成本基本上是Laplace方法确保该方法可扩展性的方法。我们用模拟和实际数据说明了该方法及其优势，小而大规模。

translated by 谷歌翻译

The Infinitesimal Jackknife and Combinations of Models

Indrayudh Ghosal , Yunzhe Zhou , Giles Hooker

分类： (统计)机器学习 | 机器学习

2022-08-31

无穷小夹刀是一种估计参数模型方差的通用方法，最近也用于某些集合方法。在本文中，我们扩展了无穷小折刀，以估计任意两种模型之间的协方差。这可用于量化模型组合的不确定性，或构建测试统计信息，以比较使用相同训练数据集拟合的模型的不同模型或组合。本文中的具体示例使用了随机森林和M估计剂等模型的增强组合。我们还研究了其在XGBOOST模型的神经网络和集合上的应用。我们通过广泛的模拟及其在北京住房数据中的应用来说明差异估计的疗效，并证明了无穷小折刀协方差估算的理论一致性。

translated by 谷歌翻译

On the Relation between Prediction and Imputation Accuracy under Missing Covariates

Burim Ramosaj , Justus Tulowietzki , Markus Pauly

分类： (统计)机器学习 | 机器学习

2021-12-09

回归或分类问题中缺少的协变量可以禁止直接使用先进的工具进行进一步分析。最近的研究已经实现了现代机器学习算法的升值越来越大的趋势。它起源于它们在不同学习问题中显示有利预测准确性的能力。在这项工作中，我们通过仿真分析了在基于机器学习和预测的基于机器学习方法时，缺少协变的回归学习问题之间的归零精确度和预测准确性之间的相互作用。此外，我们在使用预测设置中使用统计推理过程时，我们探讨了升级性能，例如（有效）预测间隔的覆盖率。我们的分析基于UCI机器学习存储库提供的实证数据集和广泛的仿真研究。

translated by 谷歌翻译

Federated Causal Inference in Heterogeneous Observational Data

Ruoxuan Xiong , Allison Koenecke , Michael Powell , Zhu Shen , Joshua T. Vogelstein , Susan Athey

分类：机器学习

2021-07-25

We are interested in estimating the effect of a treatment applied to individuals at multiple sites, where data is stored locally for each site. Due to privacy constraints, individual-level data cannot be shared across sites; the sites may also have heterogeneous populations and treatment assignment mechanisms. Motivated by these considerations, we develop federated methods to draw inference on the average treatment effects of combined data across sites. Our methods first compute summary statistics locally using propensity scores and then aggregate these statistics across sites to obtain point and variance estimators of average treatment effects. We show that these estimators are consistent and asymptotically normal. To achieve these asymptotic properties, we find that the aggregation schemes need to account for the heterogeneity in treatment assignments and in outcomes across sites. We demonstrate the validity of our federated methods through a comparative study of two large medical claims databases.

translated by 谷歌翻译

Semi-Supervised Empirical Risk Minimization: Using unlabeled data to improve prediction

Oren Yuval , Saharon Rosset

分类： (统计)机器学习 | 机器学习

2020-09-01

我们提出了一种使用未标记数据来设计半导体风险最小化（ERM）学习过程的半监督学习（SSL）变体的一般方法。专注于广义线性回归，我们分析了我们SSL方法提高预测性能的有效性。关键的想法是仔细考虑NULL模型作为竞争对手，并利用未标记的数据来确定SSL优于监督学习和空模型的信号噪声组合。然后，我们基于信号和噪声的估计以自适应方式使用SSL。在与高斯协变者线性回归的特殊情况下，我们证明了非自适应SSL版本实际上无法同时在监督估计器和空模型上改善，超出可忽略的O（1 / N）项。另一方面，在这项工作中提供的自适应模型，可以在各种设置下同时实现对两个竞争对手的重大改进。这是通过广泛的模拟凭经验显示的，并扩展到其他场景，例如非高斯协变量，错过的线性回归或具有非线性链路功能的广义线性回归。

translated by 谷歌翻译

Distribution-free Prediction Sets Adaptive to Unknown Covariate Shift

Hongxiang Qiu , Edgar Dobriban , Eric Tchetgen Tchetgen

分类： (统计)机器学习

2022-03-11

预测一组结果 - 而不是独特的结果 - 是统计学习中不确定性定量的有前途的解决方案。尽管有关于构建具有统计保证的预测集的丰富文献，但适应未知的协变量转变（实践中普遍存在的问题）还是一个严重的未解决的挑战。在本文中，我们表明具有有限样本覆盖范围保证的预测集是非信息性的，并提出了一种新型的无灵活分配方法PredSet-1Step，以有效地构建了在未知协方差转移下具有渐近覆盖范围保证的预测集。我们正式表明我们的方法是\ textIt {渐近上可能是近似正确}，对大型样本的置信度有很好的覆盖误差。我们说明，在南非队列研究中，它在许多实验和有关HIV风险预测的数据集中实现了名义覆盖范围。我们的理论取决于基于一般渐近线性估计器的WALD置信区间覆盖范围的融合率的新结合。

translated by 谷歌翻译

Statistical Properties of the log-cosh Loss Function Used in Machine Learning

Resve A. Saleh , A. K. Md. Ehsanes Saleh

分类： (统计)机器学习 | 机器学习

2022-08-09

本文分析了机器学习中使用的流行损失函数，称为log-cosh损失函数。已经使用此损失函数发表了许多论文，但迄今为止，文献中尚未介绍统计分析。在本文中，我们介绍了对日志cosh损失的分布函数。我们将其与类似的分布进行比较，称为Cauchy分布，并执行了特征其性质的各种统计程序。特别是，我们检查了其相关的PDF，CDF，似然函数和Fisher信息。并排考虑具有渐近偏置，渐近方差和置信区间的位置参数的MLE的cauchy和COSH分布。我们还提供了来自其他几个损失函数的强大估计器的比较，包括Huber损失函数和等级分散函数。此外，我们检查了对数字-COSH函数在分位数回归中的使用。特别是，我们确定了一个分位数分布函数，可以从中得出最大似然估计量。最后，我们将基于log-cosh的分位数m静态器与稳健的单调性与基于卷积平滑的另一种分位回归方法进行比较。

translated by 谷歌翻译

Network Influence with Latent Homophily and Measurement Error

Subhadeep Paul , Shanjukta Nath , Keith Warren

分类： (统计)机器学习

2022-03-27

在几个科学学科中，建模对网络连接个体结果的社会影响是一个中心研究问题。但是，网络影响无法从观察数据中鉴定出来，因为它与未观察到的同质性混淆。我们提出了一种潜在的同质调整后的空间自回归模型（SAR），以识别因果传播效应。潜在同质性是根据网络邻接矩阵的光谱嵌入来估计的。当通过误差测量协变量时，我们进一步开发了SAR模型参数的最大似然估计器。偏置校正的MLE具有统计一致性和渐进式性能。我们将估计的潜在同质性与SAR模型中的偏差校正MLE相结合，以估计网络影响。我们的模拟表明，这些方法在有限样品中的性能很好。将我们的方法应用于治疗界（TC）中女性犯罪犯罪者的数据集，我们提供了网络对TC毕业的影响的因果估计。

translated by 谷歌翻译

Noise Estimation in Gaussian Process Regression

Siavash Ameli , Shawn C. Shadden

分类：机器学习 | (统计)机器学习

2022-06-20

我们开发了一个计算程序，以估计具有附加噪声的半摩托车高斯过程回归模型的协方差超参数。也就是说，提出的方法可用于有效估计相关误差的方差，以及基于最大化边际似然函数的噪声方差。我们的方法涉及适当地降低超参数空间的维度，以简化单变量的根发现问题的估计过程。此外，我们得出了边际似然函数及其衍生物的边界和渐近线，这对于缩小高参数搜索的初始范围很有用。使用数值示例，我们证明了与传统参数优化相比，提出方法的计算优势和鲁棒性。

translated by 谷歌翻译

Beyond Matérn: On A Class of Interpretable Confluent Hypergeometric Covariance Functions

Pulong Ma , Anindya Bhadra

分类： (统计)机器学习

2019-11-14

垫子的协方差函数是空间统计和不确定性量化文献中预测的热门选择。垫子纳米级的一个主要好处是，可以精确控制随机过程的平均方形差异性。然而，垫子的纳米阶级具有指数腐烂的尾部，因此可能不适用于建模多项式腐烂的依赖性。使用多项式协方彰可以纠正这个问题;然而，在相应过程的平均方形差异程度上失去控制，在现有多项式考虑因素的随机过程中是无限的平均可分辨率或无论是均值的可分方式。我们构建一个名为\ EMPH {Confluent HyperGeometric}（CH）类的新的协方差函数系列使用垫子\'课程的比例表示，其中一个人获得垫片和多项式协方差的益处。结果协方差包含两个参数：一个控制原点附近的平均方形可分性程度，另一个控制尾部沉重，彼此独立地控制。使用光谱表示，我们导出了这种新协方差的理论属性，包括填充渐近学下的最大似然估计量的等效措施和渐近行为。通过广泛的模拟验证CH类的改进的理论特性。应用使用NASA的轨道碳观察台-2卫星数据证实了CH类在垫子类上的优势，尤其是外推设置。

translated by 谷歌翻译

Deep Neural Network Based Accelerated Failure Time Models using Rank Loss

Gwangsu Kim , Sangwook Kang

分类： (统计)机器学习 | 机器学习

2022-06-13

加速故障时间（AFT）模型假设故障时间与一组协变量之间的对数线性关系。与其他在危险功能上起作用的流行生存模型相反，协变量的影响直接对失败时间，其解释是直观的。未指定误差分布的半参数AFT模型对于与分布假设的不同是灵活且鲁棒的。由于理想的功能，这类模型被认为是对审查失败时间数据分析的流行COX模型的有希望的替代方法。但是，在这些AFT模型中，通常假定为平均值的线性预测指标。在建模平均值时，很少有研究解决了预测因素的非线性。在过去的几十年中，深度神经网络（DNNS）在各种领域都获得了杰出的成功。 DNN具有许多显着的优势，并且已被证明在解决非线性方面特别有用。通过利用此优势，我们建议使用GEHAN型损失拟合AFT模型中的DNN，并结合子采样技术。通过广泛的刺激研究研究了拟议DNN和基于等级的AFT模型（DEEPR-AFT）的有限样品特性。当预测因子是非线性时，DeepR-AFT在其参数或半摩米特里对应物上显示出卓越的性能。对于线性预测指标，当协变量的尺寸较大时，DEEPR-AFT的性能更好。使用两个真实数据集说明了所提出的DeepR-AFT，这证明了其优越性。

translated by 谷歌翻译