智能论文笔记

Auto robust relative radiometric normalization via latent change noise modelling

Shiqi Liu , Lu Wang , Jie Lian , Ting chen , Cong Liu , Xuchen Zhan , Jintao Lu , Jie Liu , Ting Wang , Dong Geng

分类：计算机视觉 | 机器学习

2021-11-24

相同地形的不同卫星图像的相对辐射归一化（RRN）对于改变检测，对象分类/分割和映射任务是必要的。但是，传统的RRN模型不强大，通过对象变化扰乱，并且RRN模型精确考虑对象变化无法鲁布布地获取无更改集。本文提出了通过潜在变化噪声建模的自动稳健的相对辐射归一化方法。它们利用先验知识，即在相对辐射尺度化下没有变化点具有小尺度噪声，并且在辐射归一化之后，变化点具有大规模的辐射噪声，组合随机期望最大化方法快速且强大地提取No-Change集以学习相对辐射归一化映射映射函数。这使我们的模型在理论上就是关于概率理论和数学扣除的基础。具体地，当我们选择直方图匹配作为与高斯噪声（HM-RRN-RRN-RRN-MOG）混合的相对辐射算法学习方案（HM-RRN-MOG）的相对辐射归一化学习方案，HM-RRN-MOG模型实现了最佳性能。我们的模型具有强大地反对云/雾气/变化的能力。我们的方法自然地为RRN生成一个强大的评估指示器，即No-Change Set Totor Square error。我们将HM-RRN-MOG模型应用于后一种植被/水变化检测任务，这减少了无辐射对比度和NDVI / NDWI对无变化集的差异，产生了一致和可比的结果。我们利用No-Change集合到建筑物变更检测任务中，有效地减少了伪变化并提高了精度。

translated by 谷歌翻译

Country-wide Retrieval of Forest Structure From Optical and SAR Satellite Imagery With Bayesian Deep Learning

Alexander Becker , Stefania Russo , Stefano Puliti , Nico Lang , Konrad Schindler , Jan Dirk Wegner

分类：计算机视觉 | 机器学习

2021-11-25

以知情方式监测和管理地球林是解决生物多样性损失和气候变化等挑战的重要要求。虽然森林评估的传统或空中运动提供了在区域一级分析的准确数据，但将其扩展到整个国家，以外的高度分辨率几乎不可能。在这项工作中，我们提出了一种贝叶斯深度学习方法，以10米的分辨率为全国范围的森林结构变量，使用自由可用的卫星图像作为输入。我们的方法将Sentinel-2光学图像和Sentinel-1合成孔径雷达图像共同变换为五种不同的森林结构变量的地图：95th高度百分位，平均高度，密度，基尼系数和分数盖。我们从挪威的41个机载激光扫描任务中培训和测试我们的模型，并证明它能够概括取消测试区域，从而达到11％和15％之间的归一化平均值误差，具体取决于变量。我们的工作也是第一个提出贝叶斯深度学习方法的工作，以预测具有良好校准的不确定性估计的森林结构变量。这些提高了模型的可信度及其适用于需要可靠的信心估计的下游任务，例如知情决策。我们提出了一组广泛的实验，以验证预测地图的准确性以及预测的不确定性的质量。为了展示可扩展性，我们为五个森林结构变量提供挪威地图。

translated by 谷歌翻译

Deep Learning Models for River Classification at Sub-Meter Resolutions from Multispectral and Panchromatic Commercial Satellite Imagery

Joachim Moortgat , Ziwei Li , Michael Durand , Ian Howat , Bidhyananda Yadav , Chunli Dai

分类：计算机视觉 | 机器学习

2022-12-27

Remote sensing of the Earth's surface water is critical in a wide range of environmental studies, from evaluating the societal impacts of seasonal droughts and floods to the large-scale implications of climate change. Consequently, a large literature exists on the classification of water from satellite imagery. Yet, previous methods have been limited by 1) the spatial resolution of public satellite imagery, 2) classification schemes that operate at the pixel level, and 3) the need for multiple spectral bands. We advance the state-of-the-art by 1) using commercial imagery with panchromatic and multispectral resolutions of 30 cm and 1.2 m, respectively, 2) developing multiple fully convolutional neural networks (FCN) that can learn the morphological features of water bodies in addition to their spectral properties, and 3) FCN that can classify water even from panchromatic imagery. This study focuses on rivers in the Arctic, using images from the Quickbird, WorldView, and GeoEye satellites. Because no training data are available at such high resolutions, we construct those manually. First, we use the RGB, and NIR bands of the 8-band multispectral sensors. Those trained models all achieve excellent precision and recall over 90% on validation data, aided by on-the-fly preprocessing of the training data specific to satellite imagery. In a novel approach, we then use results from the multispectral model to generate training data for FCN that only require panchromatic imagery, of which considerably more is available. Despite the smaller feature space, these models still achieve a precision and recall of over 85%. We provide our open-source codes and trained model parameters to the remote sensing community, which paves the way to a wide range of environmental hydrology applications at vastly superior accuracies and 2 orders of magnitude higher spatial resolution than previously possible.

translated by 谷歌翻译

An Overview on the Generation and Detection of Synthetic and Manipulated Satellite Images

Lydia Abady , Edoardo Daniele Cannas , Paolo Bestagini , Benedetta Tondi , Stefano Tubaro , Mauro Barni

分类：计算机视觉

2022-09-19

由于技术成本的降低和卫星发射的增加，卫星图像变得越来越流行和更容易获得。除了提供仁慈的目的外，还可以出于恶意原因（例如错误信息）使用卫星数据。事实上，可以依靠一般图像编辑工具来轻松操纵卫星图像。此外，随着深层神经网络（DNN）的激增，可以生成属于各种领域的现实合成图像，与合成生成的卫星图像的扩散有关的其他威胁正在出现。在本文中，我们回顾了关于卫星图像的产生和操纵的最新技术（SOTA）。特别是，我们既关注从头开始的合成卫星图像的产生，又要通过图像转移技术对卫星图像进行语义操纵，包括从一种类型的传感器到另一种传感器获得的图像的转换。我们还描述了迄今已研究的法医检测技术，以对合成图像伪造进行分类和检测。虽然我们主要集中在法医技术上明确定制的，该技术是针对AI生成的合成内容物的检测，但我们还审查了一些用于一般剪接检测的方法，这些方法原则上也可以用于发现AI操纵图像

translated by 谷歌翻译

Learning a Joint Embedding of Multiple Satellite Sensors: A Case Study for Lake Ice Monitoring

Manu Tom , Yuchang Jiang , Emmanuel Baltsavias , Konrad Schindler

分类：计算机视觉

2021-07-19

Fusing satellite imagery acquired with different sensors has been a long-standing challenge of Earth observation, particularly across different modalities such as optical and Synthetic Aperture Radar (SAR) images. Here, we explore the joint analysis of imagery from different sensors in the light of representation learning: we propose to learn a joint embedding of multiple satellite sensors within a deep neural network. Our application problem is the monitoring of lake ice on Alpine lakes. To reach the temporal resolution requirement of the Swiss Global Climate Observing System (GCOS) office, we combine three image sources: Sentinel-1 SAR (S1-SAR), Terra MODIS, and Suomi-NPP VIIRS. The large gaps between the optical and SAR domains and between the sensor resolutions make this a challenging instance of the sensor fusion problem. Our approach can be classified as a late fusion that is learned in a data-driven manner. The proposed network architecture has separate encoding branches for each image sensor, which feed into a single latent embedding. I.e., a common feature representation shared by all inputs, such that subsequent processing steps deliver comparable output irrespective of which sort of input image was used. By fusing satellite data, we map lake ice at a temporal resolution of < 1.5 days. The network produces spatially explicit lake ice maps with pixel-wise accuracies > 91% (respectively, mIoU scores > 60%) and generalises well across different lakes and winters. Moreover, it sets a new state-of-the-art for determining the important ice-on and ice-off dates for the target lakes, in many cases meeting the GCOS requirement.

translated by 谷歌翻译

Geometry of EM and related iterative algorithms

Hideitsu Hino , Shotaro Akaho , Noboru Murata

分类： (统计)机器学习 | 机器学习

2022-09-03

期望 - 最大化（EM）算法是一种简单的元叠加，当观察到的数据中缺少测量值或数据由可观察到的数据组成时，它已多年来用作统计推断的方法。它的一般属性进行了充分的研究，而且还有无数方法将其应用于个人问题。在本文中，我们介绍了$ em $ $ and算法，EM算法的信息几何公式及其扩展和应用程序以及各种问题。具体而言，我们将看到，可以制定一个异常稳定推理算法，用于计算通道容量的算法，概率单纯性的参数估计方法，特定的多变量分析方法，例如概率模型中的主要组件分析和模态回归中的主成分分析，基质分解和学习生成模型，这些模型最近从几何学角度引起了深度学习的关注。

translated by 谷歌翻译

Towards Daily High-resolution Inundation Observations using Deep Learning and EO

Antara Dasgupta , Lasse Hybbeneth , Björn Waske

分类：计算机视觉 | 机器学习

2022-08-10

卫星遥感提供了一种具有成本效益的概要洪水监测的解决方案，卫星衍生的洪水图为传统上使用的数值洪水淹没模型提供了一种计算有效的替代方法。尽管卫星碰巧涵盖正在进行的洪水事件时确实提供了及时的淹没信息，但它们受其时空分辨率的限制，因为它们在各种规模上动态监测洪水演变的能力。不断改善对新卫星数据源的访问以及大数据处理功能，就此问题的数据驱动解决方案而言，已经解锁了前所未有的可能性。具体而言，来自卫星的数据融合，例如哥白尼前哨，它们具有很高的空间和低时间分辨率，以及来自NASA SMAP和GPM任务的数据，它们的空间较低，但时间较高的时间分辨率可能会导致高分辨率的洪水淹没在A处的高分辨率洪水。每日规模。在这里，使用Sentinel-1合成孔径雷达和各种水文，地形和基于土地利用的预测因子衍生出的洪水淹没图对卷积神经网络进行了训练，以预测高分辨率的洪水泛滥概率图。使用Sentinel-1和Sentinel-2衍生的洪水面罩，评估了UNET和SEGNET模型架构的性能，分别具有95％的信心间隔。精确召回曲线（PR-AUC）曲线下的区域（AUC）被用作主要评估指标，这是由于二进制洪水映射问题中类固有的不平衡性质，最佳模型提供了PR-AUC 0.85。

translated by 谷歌翻译

A CNN based method for Sub-pixel Urban Land Cover Classification using Landsat-5 TM and Resourcesat-1 LISS-IV Imagery

Krishna Kumar Perikamana , Krishnachandran Balakrishnan , Pratyush Tripathy

分类：计算机视觉 | 机器学习

2021-12-16

城市土地覆盖的时间序列数据在分析城市增长模式方面具有很大的效用，不透水表面和植被的分布变化以及对城市微观气候产生影响。虽然Landsat数据非常适于这种分析，但由于长时间系列的免费图像，传统的每像素硬分类未能产生Landsat数据的全部潜力。本文提出了一种子像素分类方法，其利用Landsat-5 TM和Resorational-1 Liss-IV传感器的时间重叠。我们训练卷积神经网络，预测30米Landsat-5 TM数据的分数陆地覆盖。从2011年的Bengaluru的一个艰难的5.8M Liss-IV图像估计参考陆地覆盖分数。此外，我们从2009年使用Mumbai数据并将其与使用的结果进行了概括和卓越的性能随机森林分类器。对于Bengaluru（2011）和Mumbai（2009）数据，我们的CNN模型的平均绝对百分比误差在30M细胞水平上的内置和植被分数预测的7.2至11.3。与最近的最近的研究不同，在使用数据在空间范围进行有限的空间范围进行验证，我们的模型已经过度培训并验证了两个不同时间段的两个Mega城市的完整空间范围的数据。因此，它可以可靠地从Landsat-5 TM时间序列数据中可靠地产生30M内置和植被分数图，以分析长期城市增长模式。

translated by 谷歌翻译

A framework for deep learning emulation of numerical models with a case study in satellite remote sensing

Kate Duffy , Thomas Vandal , Weile Wang , Ramakrishna Nemani , Auroop R. Ganguly

分类：机器学习 | (统计)机器学习

2019-10-29

基于物理学的数值模型代表了地球系统建模中的最先进，包括我们的最佳工具，用于产生洞察和预测。尽管计算能力快速增长，但对更高模型分辨率的感知需求压倒了最新一代电脑，降低了建模者为理解参数敏感性和表征变异性和不确定性而产生模拟的能力。因此，通常开发了代理模型以捕获全吹制数值的基本属性。最近的机器学习方法的成功，尤其是深度学习，跨越许多学科提供了复杂的非线性连接者表示可能能够捕获地球系统中的底层复杂结构和非线性过程的可能性。基于深度学习的仿真的难度测试，这是指数值模型的近似，是为了了解它们是否可以在计算效率方面与传统形式的代理模型相当，同时再现模型以可靠的方式再现模型。可以预期通过该测试的深度学习仿真，而不是捕获复杂进程和时空依赖性的简单模型来表现更好。在这里，我们检查了基于卫星的遥感的案例研究，深度学习方法可以可靠地代表来自代理模型的模拟，具有可比的计算效率。我们的结果令人鼓舞的是，深度学习仿真以可接受的准确性再现结果，并且往往更快的性能。我们阐明了我们对深度学习的高性能实现的改进步伐的更广泛的影响以及地球科学中更高分辨率模拟的渴望。

translated by 谷歌翻译

S2Looking: A Satellite Side-Looking Dataset for Building Change Detection

Li Shen , Yao Lu , Hao Chen , Hao Wei , Donghai Xie , Jiabao Yue , Rui Chen , Shouye Lv , Bitao Jiang

分类：计算机视觉 | 人工智能

2021-07-20

建筑变更检测是许多重要应用，特别是在军事和危机管理领域。最近用于变化检测的方法已转向深度学习，这取决于其培训数据的质量。因此，大型注释卫星图像数据集的组装对于全球建筑更改监视是必不可少的。现有数据集几乎完全提供近Nadir观看角度。这限制了可以检测到的更改范围。通过提供更大的观察范围，光学卫星的滚动成像模式提出了克服这种限制的机会。因此，本文介绍了S2Looking，一个建筑变革检测数据集，其中包含以各种偏离Nadir角度捕获的大规模侧视卫星图像。 DataSet由5000个批次图像对组成的农村地区，并在全球范围内超过65,920个辅助的变化实例。数据集可用于培训基于深度学习的变更检测算法。它通过提供（1）更大的观察角来扩展现有数据集; （2）大照明差异; （3）额外的农村形象复杂性。为了便于{该数据集的使用，已经建立了基准任务，并且初步测试表明，深度学习算法发现数据集明显比最接近的近Nadir DataSet，Levir-CD +更具挑战性。因此，S2Looking可能会促进现有的建筑变革检测算法的重要进步。 DataSet可在https://github.com/s2looking/使用。

translated by 谷歌翻译

Generating gapless land surface temperature with a high spatio-temporal resolution by fusing multi-source satellite-observed and model-simulated data

Jun Ma , Huanfeng Shen , Penghai Wu , Jingan Wu , Meiling Gao , Chunlei Meng

分类：人工智能

2021-11-29

陆地温度（LST）是监控土地面过程时的关键参数。然而，云污染和空间和时间分辨率之间的权衡大大妨碍了对高质量的热红外（TIR）遥感数据的访问。尽管采取了巨大的努力来解决这些困境，但仍然难以通过并发空间完整性和高时空分辨率产生LST估计。陆地表面模型（LSM）可用于模拟高度的时间分辨率的Genpless LST，但这通常具有低空间分辨率。在本文中，我们向卫星观察和LSM模拟LST数据提供了一个集成的温度融合框架，以通过60米的空间分辨率和半小时时间分辨率映射Gapless LST。全局线性模型（GLOLM）模型和昼夜陆地表面温度周期（DTC）模型分别作为预处理步骤进行传感器和不同LST数据之间的时间归一化。然后使用基于滤波器的时空集成融合模型融合Landsat LST，适度分辨率成像光谱仪（MODIS）LST和社区土地模型5.0（CLM 5.0）-SIMUTION LST。在一个城市主导地区（中国武汉市）和自然主导地区（中国海河流域）实施了评估，在准确性，空间可变性和日颞动力学方面。结果表明，熔融LST与实际LANDSAT LST数据（原位LST测量）高于Pearson相关系数，在0.94（0.97-0.99）方面，平均绝对误差为0.71-0.98k（0.82-3.17 k ）和根平均误差为0.97-1.26 k（1.09-3.97 k）。

translated by 谷歌翻译

Latent Variable Models in the Era of Industrial Big Data: Extension and Beyond

Xiangyin Kong , Xiaoyu Jiang , Bingxin Zhang , Jinsong Yuan , Zhiqiang Ge

分类：机器学习

2022-08-23

大量的数据和创新算法使数据驱动的建模成为现代行业的流行技术。在各种数据驱动方法中，潜在变量模型（LVM）及其对应物占主要份额，并在许多工业建模领域中起着至关重要的作用。 LVM通常可以分为基于统计学习的经典LVM和基于神经网络的深层LVM（DLVM）。我们首先讨论经典LVM的定义，理论和应用，该定义和应用既是综合教程，又是对经典LVM的简短申请调查。然后，我们对当前主流DLVM进行了彻底的介绍，重点是其理论和模型体系结构，此后不久就提供了有关DLVM的工业应用的详细调查。上述两种类型的LVM具有明显的优势和缺点。具体而言，经典的LVM具有简洁的原理和良好的解释性，但是它们的模型能力无法解决复杂的任务。基于神经网络的DLVM具有足够的模型能力，可以在复杂的场景中实现令人满意的性能，但它以模型的解释性和效率为例。旨在结合美德并减轻这两种类型的LVM的缺点，并探索非神经网络的举止以建立深层模型，我们提出了一个新颖的概念，称为“轻量级Deep LVM（LDLVM）”。在提出了这个新想法之后，该文章首先阐述了LDLVM的动机和内涵，然后提供了两个新颖的LDLVM，并详尽地描述了其原理，建筑和优点。最后，讨论了前景和机会，包括重要的开放问题和可能的研究方向。

translated by 谷歌翻译

Classical Planning in Deep Latent Space

Masataro Asai , Hiroshi Kajino , Alex Fukunaga , Christian Muise

分类：人工智能 | 机器学习

2021-06-30

当前独立于域的经典计划者需要问题域和实例作为输入的符号模型，从而导致知识采集瓶颈。同时，尽管深度学习在许多领域都取得了重大成功，但知识是在与符号系统（例如计划者）不兼容的亚符号表示中编码的。我们提出了Latplan，这是一种无监督的建筑，结合了深度学习和经典计划。只有一组未标记的图像对，显示了环境中允许的过渡子集（训练输入），Latplan学习了环境的完整命题PDDL动作模型。稍后，当给出代表初始状态和目标状态（计划输入）的一对图像时，Latplan在符号潜在空间中找到了目标状态的计划，并返回可视化的计划执行。我们使用6个计划域的基于图像的版本来评估LATPLAN：8个插头，15个式嘴，Blockworld，Sokoban和两个LightsOut的变体。

translated by 谷歌翻译

Dr. Neurosymbolic, or: How I Learned to Stop Worrying and Accept Statistics

Masataro Asai

分类：人工智能 | 机器学习

2022-09-08

象征性的AI社区越来越多地试图在神经符号结构中接受机器学习，但由于文化障碍，仍在挣扎。为了打破障碍，这份相当有思想的个人备忘录试图解释和纠正统计，机器学习和深入学习的惯例，从局外人的角度进行深入学习。它提供了一个分步协议，用于设计一个机器学习系统，该系统满足符号AI社区认真对待所必需的最低理论保证，即，它讨论“在哪些条件下，我们可以停止担心和接受统计机器学习。 “一些亮点：大多数教科书都是为计划专门研究STAT/ML/DL的人编写的，应该接受术语。该备忘录适用于经验丰富的象征研究人员，他们听到了很多嗡嗡声，但仍然不确定和持怀疑态度。有关STAT/ML/DL的信息目前太分散或嘈杂而无法投资。此备忘录优先考虑紧凑性，并特别注意与象征性范式相互共鸣的概念。我希望这份备忘录能节省时间。它优先考虑一般数学建模，并且不讨论任何特定的函数近似器，例如神经网络（NNS），SVMS，决策树等。它可以对校正开放。将此备忘录视为与博客文章相似的内容，采用有关Arxiv的论文的形式。

translated by 谷歌翻译

Reliable amortized variational inference with physics-based latent distribution correction

Ali Siahkoohi , Gabrio Rizzuti , Rafael Orozco , Felix J. Herrmann

分类： (统计)机器学习 | 机器学习

2022-07-24

远期操作员的计算成本和选择适当的先前分布的计算成本挑战了贝叶斯对高维逆问题的推断。摊销的变异推理解决了这些挑战，在这些挑战中，训练神经网络以近似于现有模型和数据对的后验分布。如果以前看不见的数据和正态分布的潜在样品作为输入，则预处理的深神经网络（在我们的情况下是有条件的正常化流量）几乎没有成本的后验样品。然而，这种方法的准确性取决于高保真训练数据的可用性，由于地球的异质结构，由于地球物理逆问题很少存在。此外，准确的摊销变异推断需要从训练数据分布中汲取观察到的数据。因此，我们建议通过基于物理学的校正对有条件的归一化流量分布来提高摊销变异推断的弹性。为了实现这一目标，我们不是标准的高斯潜在分布，我们通过具有未知平均值和对角线协方差的高斯分布来对潜在分布进行参数化。然后，通过最小化校正后分布和真实后验分布之间的kullback-leibler差异来估算这些未知数量。尽管通用和适用于其他反问题，但通过地震成像示例，我们表明我们的校正步骤可提高摊销变异推理的鲁棒性，以相对于源实验数量的变化，噪声方差以及先前分布的变化。这种方法提供了伪像有限的地震图像，并评估其不确定性，其成本大致与五个反度迁移相同。

translated by 谷歌翻译

Detecting Crop Burning in India using Satellite Data

Kendra Walker , Ben Moscona , Kelsey Jack , Seema Jayachandran , Namrata Kala , Rohini Pande , Jiani Xue , Marshall Burke

分类：计算机视觉 | 机器学习

2022-09-21

农作物残留物燃烧是世界许多地方的空气污染的主要来源，尤其是南亚。政策制定者，从业人员和研究人员都投资了衡量影响和制定干预措施以减少燃烧。但是，测量燃烧的影响或干预措施的有效性减少燃烧需要数据燃烧的位置。这些数据在成本和可行性方面都在现场收集具有挑战性。我们利用印度旁遮普邦旁遮普邦农作物残留物燃烧的地面监测的数据，以探索使用可访问的卫星图像是否可以更有效地检测到燃烧。具体而言，我们使用了具有高时间分辨率（最多每天）的3M Planetscope数据以及具有每周时间分辨率但光谱信息深度的公共可用Sentinel-2数据。在分析了不同光谱带和燃烧指数单独分离燃烧和未燃烧图的能力之后，我们构建了一个随机森林模型，这些模型确定提供了最大的分离性，并用地面验证的数据评估了模型性能。鉴于测量所带来的挑战，我们的总体模型精度为82％是有利的。基于此过程的见解，我们讨论了检测卫星图像中农作物残留物燃烧的技术挑战，以及衡量燃烧和政策干预措施的影响的挑战。

translated by 谷歌翻译

A Machine Learning Data Fusion Model for Soil Moisture Retrieval

Vishal Batchu , Grey Nearing , Varun Gulshan

分类：机器学习

2022-06-20

我们开发了一个基于深度学习的卷积回归模型，该模型估计了土壤顶部〜5 cm中的体积土壤水分含量。输入预测因子包括Sentinel-1（活动雷达），Sentinel-2（光学图像）和SMAP（被动雷达），以及来自GLDAS的土壤格林和建模土壤水分领域的地球物理变量。该模型在2015年至2021年期间对全球约1300个原位传感器的数据进行了训练和评估，并获得了0.727的平均每传感器相关性为0.727，UBRMSE为0.054，可用于在名义上生产土壤水分图。320m分辨率。这些结果是针对不同位置的其他13个土壤水分厂进行基准测试的，并使用消融研究来识别重要的预测因子。

translated by 谷歌翻译

Resolving label uncertainty with implicit posterior models

Esther Rolf , Nikolay Malkin , Alexandros Graikos , Ana Jojic , Caleb Robinson , Nebojsa Jojic

分类：机器学习 | (统计)机器学习

2022-02-28

我们提出了一种在数据样本集合中共同推断标签的方法，其中每个样本都包含一个观察和对标签的先验信念。通过隐式假设存在一种生成模型，可区分预测因子是后部，我们得出了一个训练目标，该目标允许在弱信念下学习。该配方统一了各种机器学习设置；弱信念可以以嘈杂或不完整的标签形式出现，由辅助输入的不同预测机制给出的可能性，或反映出有关手头问题结构的知识的常识性先验。我们证明了有关各种问题的建议算法：通过负面培训示例进行分类，从排名中学习，弱和自我监督的空中成像细分，视频框架的共段以及粗糙的监督文本分类。

translated by 谷歌翻译

An Introduction to Modern Statistical Learning

Joseph G. Makin

分类：机器学习

2022-07-20

这项正在进行的工作旨在为统计学习提供统一的介绍，从诸如GMM和HMM等经典模型到现代神经网络（如VAE和扩散模型）缓慢地构建。如今，有许多互联网资源可以孤立地解释这一点或新的机器学习算法，但是它们并没有（也不能在如此简短的空间中）将这些算法彼此连接起来，或者与统计模型的经典文献相连现代算法出现了。同样明显缺乏的是一个单一的符号系统，尽管对那些已经熟悉材料的人（如这些帖子的作者）不满意，但对新手的入境造成了重大障碍。同样，我的目的是将各种模型（尽可能）吸收到一个用于推理和学习的框架上，表明（以及为什么）如何以最小的变化将一个模型更改为另一个模型（其中一些是新颖的，另一些是文献中的）。某些背景当然是必要的。我以为读者熟悉基本的多变量计算，概率和统计以及线性代数。这本书的目标当然不是完整性，而是从基本知识到过去十年中极强大的新模型的直线路径或多或少。然后，目标是补充而不是替换，诸如Bishop的\ emph {模式识别和机器学习}之类的综合文本，该文本现在已经15岁了。

translated by 谷歌翻译

Hyperspectral Remote Sensing Benchmark Database for Oil Spill Detection with an Isolation Forest-Guided Unsupervised Detector

Puhong Duan , Xudong Kang , Pedram Ghamisi

分类：计算机视觉 | 机器学习

2022-09-28

近年来，由于海洋漏油事故严重影响环境，自然资源和沿海居民的生活，近年来，漏油事件引起了人们的关注。高光谱遥感图像提供了丰富的光谱信息，这对在复杂的海洋场景中监测漏油物有益。但是，大多数现有方法都是基于受监督和半监督的框架来检测高光谱图像（HSIS）的漏油事件，这些框架需要大量努力来注释一定数量的高质量训练集。在这项研究中，我们首次尝试基于HSIS的隔离森林开发无监督的漏油检测方法。首先，考虑到噪声水平在不同的频段之间有所不同，因此利用了噪声方差估计方法来评估不同频段的噪声水平，并且消除了因严重噪声而损坏的频段。其次，使用内核主成分分析（KPCA）来降低HSIS的高维度。然后，用隔离林估计属于海水和油泄漏之一的每个像素的概率，并且使用群集算法在检测到的概率上自动生产一组伪标记的训练样品。最后，可以通过在减少尺寸的数据上执行支持向量机（SVM）来获得初始检测图，然后，使用扩展的随机Walker（ERW）模型进一步优化初始检测结果，以改善检测检测漏油的准确性。关于我们自己创建的空气传播高光谱漏油数据（HOSD）的实验表明，该方法在其他最先进的检测方法方面获得了卓越的检测性能。

translated by 谷歌翻译