当前对火星(新鲜)影响的库存表现出对低热惯性区域的强烈偏见。这些区域通常在视觉上明亮,影响会产生黑暗的冲浪和射线,从而使它们更易于检测。预计在较高的热惯性区域以类似的速度发生影响,但这些影响不足。这项研究调查了使用训练有素的机器学习分类器,以使用CTX数据来增加对火星新鲜影响的检测。这种方法发现了69种新的新鲜影响,这些影响已通过后续的Hirise图像得到了证实。我们发现,检查由热惯性(TI)值分区的候选物值,仅由于大量的机器学习候选物而可能有助于减少观察偏置并增加已知的高TI影响的数量。
translated by 谷歌翻译
我们采用自我监督的代表性学习来从深色能源仪器遗产成像调查的数据释放9中从7600万个星系图像中提取信息9.针对新的强力引力镜头候选者的识别,我们首先创建了快速的相似性搜索工具,以发现新的搜索工具强镜仅给出一个单个标记的示例。然后,我们展示如何在自我监督的表示上训练简单的线性分类器,仅需几分钟即可在CPU上进行几分钟,可以自动以极高的效率对强镜进行分类。我们提出了1192个新的强镜候选者,我们通过简短的视觉标识活动确定,并释放一种基于Web的相似性搜索工具和顶级网络预测,以促进众包快速发现额外的强力镜头和其他稀有物体:HTTPS:https://github.com/georgestein/ssl-legacysurvey。
translated by 谷歌翻译
我们介绍了Galaxy动物园贴花:SDSS DR8占地面积的星系中的黑色能量相机传统调查图像的详细视觉形态学分类。更深的贴花图像(R = 23.6与SDSS的r = 22.2)显示螺旋臂,弱杆和在SDSS成像中未见的潮汐功能。为了最佳利用较大的贴花图像,志愿者从一套新的答案中选择,旨在提高对合并和酒吧的敏感性。 Galaxy动物园志愿者提供750万个单独的分类超过314,000个星系。 140,000个星系收到至少30分类,足以准确测量像条状的详细的形态,其余的收到约5.所有分类都用于培训贝叶斯卷积神经网络的集合(一种最先进的深度学习方法)预测所有314,000个星系的详细形态的后海外。当衡量自信的志愿者分类时,每个问题的网络大约有99%。形态学是每个星系的基本特征;我们的人机和机器分类是理解星系如何发展的准确和详细资源。
translated by 谷歌翻译
尽管地面望远镜已经发现了许多近地的物体,但观测值却错过了一些快速移动的物体,尤其是那些近地检测限制的物体。我们开发了一个卷积神经网络,用于检测微弱的快速移动近地物体。它是通过模拟产生的人造条纹训练的,并且能够在模拟数据上找到这些小行星条纹的精度为98.7%,虚假正率为0.02%。该程序用于在2019年的四个晚上搜索来自Zwicky瞬态设施(ZTF)的图像数据,并确定了六个先前未被发现的小行星。我们的检测的视觉幅度范围为〜19.0-20.3,运动速率范围为〜6.8-24 dEG/天,与其他ZTF检测相比,这非常微弱。我们的小行星的大小也〜1-51 m,在近距离接近时〜5-60个月距距离〜5-60个月距离距离,假设其反照率值遵循已知的小行星的反照率分布函数。使用纯模拟的数据集来训练我们的模型,使该程序能够在检测微弱和快速移动的对象方面获得灵敏度,同时仍然能够恢复几乎所有使用真实检测来训练神经网络的神经网络几乎所有发现。我们的方法可以被任何观测员用于检测快速移动的小行星条纹。
translated by 谷歌翻译
小型太阳能光伏(PV)阵列中电网的有效集成计划需要访问高质量的数据:单个太阳能PV阵列的位置和功率容量。不幸的是,不存在小型太阳能光伏的国家数据库。那些确实有限的空间分辨率,通常汇总到州或国家一级。尽管已经发布了几种有希望的太阳能光伏检测方法,但根据研究,研究这些模型的性能通常是高度异质的。这些方法对能源评估的实际应用的比较变得具有挑战性,可能意味着报告的绩效评估过于乐观。异质性有多种形式,我们在这项工作中探讨了每种形式:空间聚集的水平,地面真理的验证,培训和验证数据集的不一致以及培训的位置和传感器的多样性程度和验证数据始发。对于每个人,我们都会讨论文献中的新兴实践,以解决它们或暗示未来研究的方向。作为调查的一部分,我们评估了两个大区域的太阳PV识别性能。我们的发现表明,由于验证过程中的共同局限性,从卫星图像对太阳PV自动识别的传统绩效评估可能是乐观的。这项工作的收获旨在为能源研究人员和专业人员提供自动太阳能光伏评估技术的大规模实用应用。
translated by 谷歌翻译
卫星遥感提供了一种具有成本效益的概要洪水监测的解决方案,卫星衍生的洪水图为传统上使用的数值洪水淹没模型提供了一种计算有效的替代方法。尽管卫星碰巧涵盖正在进行的洪水事件时确实提供了及时的淹没信息,但它们受其时空分辨率的限制,因为它们在各种规模上动态监测洪水演变的能力。不断改善对新卫星数据源的访问以及大数据处理功能,就此问题的数据驱动解决方案而言,已经解锁了前所未有的可能性。具体而言,来自卫星的数据融合,例如哥白尼前哨,它们具有很高的空间和低时间分辨率,以及来自NASA SMAP和GPM任务的数据,它们的空间较低,但时间较高的时间分辨率可能会导致高分辨率的洪水淹没在A处的高分辨率洪水。每日规模。在这里,使用Sentinel-1合成孔径雷达和各种水文,地形和基于土地利用的预测因子衍生出的洪水淹没图对卷积神经网络进行了训练,以预测高分辨率的洪水泛滥概率图。使用Sentinel-1和Sentinel-2衍生的洪水面罩,评估了UNET和SEGNET模型架构的性能,分别具有95%的信心间隔。精确召回曲线(PR-AUC)曲线下的区域(AUC)被用作主要评估指标,这是由于二进制洪水映射问题中类固有的不平衡性质,最佳模型提供了PR-AUC 0.85。
translated by 谷歌翻译
近年来,新发现的矿物沉积物数量和不同矿物质需求的增加有LED探索地质学家,寻找在矿物勘探的每个阶段加工不同数据类型的更有效和创新的方法。作为主要步骤,诸如岩性单元,改变类型,结构和指示剂矿物的各种特征被映射以辅助靶向矿床的决策。不同类型的遥感数据集如卫星和空气传播数据,使得可以克服与映射地质特征相关的常见问题。从不同平台获得的遥感数据量的快速增加鼓励科学家培养先进,创新和强大的数据处理方法。机器学习方法可以帮助处理广泛的遥感数据集,并确定诸如反射连续体和感兴趣的特征的组件之间的关系。这些方法在处理频谱和地面真理测量中是稳健的,用于噪声和不确定性。近年来,通过补充与遥感数据集的地质调查进行了许多研究,现在在地球科学研究中突出。本文对一些流行的和最近建立的机器学习方法的实施和适应提供了全面的审查,用于处理不同类型的遥感数据,并调查其用于检测各种矿床类型的应用。我们展示了组合遥感数据和机器学习方法的高能力,以映射对于提供潜在地图至关重要的不同地质特征。此外,我们发现高级方法的范围来处理新一代遥感数据,以创建改进的矿物前景图。
translated by 谷歌翻译
Crop type maps are critical for tracking agricultural land use and estimating crop production. Remote sensing has proven an efficient and reliable tool for creating these maps in regions with abundant ground labels for model training, yet these labels remain difficult to obtain in many regions and years. NASA's Global Ecosystem Dynamics Investigation (GEDI) spaceborne lidar instrument, originally designed for forest monitoring, has shown promise for distinguishing tall and short crops. In the current study, we leverage GEDI to develop wall-to-wall maps of short vs tall crops on a global scale at 10 m resolution for 2019-2021. Specifically, we show that (1) GEDI returns can reliably be classified into tall and short crops after removing shots with extreme view angles or topographic slope, (2) the frequency of tall crops over time can be used to identify months when tall crops are at their peak height, and (3) GEDI shots in these months can then be used to train random forest models that use Sentinel-2 time series to accurately predict short vs. tall crops. Independent reference data from around the world are then used to evaluate these GEDI-S2 maps. We find that GEDI-S2 performed nearly as well as models trained on thousands of local reference training points, with accuracies of at least 87% and often above 90% throughout the Americas, Europe, and East Asia. Systematic underestimation of tall crop area was observed in regions where crops frequently exhibit low biomass, namely Africa and South Asia, and further work is needed in these systems. Although the GEDI-S2 approach only differentiates tall from short crops, in many landscapes this distinction goes a long way toward mapping the main individual crop types. The combination of GEDI and Sentinel-2 thus presents a very promising path towards global crop mapping with minimal reliance on ground data.
translated by 谷歌翻译
对联合国可持续发展目标的进展(SDGS)因关键环境和社会经济指标缺乏数据而受到阻碍,其中历史上有稀疏时间和空间覆盖率的地面调查。机器学习的最新进展使得可以利用丰富,频繁更新和全球可用的数据,例如卫星或社交媒体,以向SDGS提供洞察力。尽管有希望的早期结果,但到目前为止使用此类SDG测量数据的方法在很大程度上在不同的数据集或使用不一致的评估指标上进行了评估,使得难以理解的性能是改善,并且额外研究将是最丰富的。此外,处理卫星和地面调查数据需要域知识,其中许多机器学习群落缺乏。在本文中,我们介绍了3个SDG的3个基准任务的集合,包括与经济发展,农业,健康,教育,水和卫生,气候行动和陆地生命相关的任务。 15个任务中的11个数据集首次公开发布。我们为Acceptandbench的目标是(1)降低机器学习界的进入的障碍,以促进衡量和实现SDGS; (2)提供标准基准,用于评估各种SDG的任务的机器学习模型; (3)鼓励开发新颖的机器学习方法,改进的模型性能促进了对SDG的进展。
translated by 谷歌翻译
我们提出了一种基于机器学习的新型方法,用于从干涉数据中检测出星系尺度的重力透镜,特别是使用国际Lofar望远镜(ILT)采用的方法,该镜头是在150 MHz的频率上观察到北部无线电天空,该频率是350的角度分辨率。 MAS和90 Ujy Beam-1(1 Sigma)的灵敏度。我们开发并测试了几个卷积神经网络,以确定给定样品被归类为镜头或非镜头事件的概率和不确定性。通过对包括逼真的镜头和非镜头无线电源的模拟干涉成像数据集进行训练和测试,我们发现可以恢复95.3%的镜头样品(真正的正速率),仅污染仅为0.008来自非静态样品(假阳性速率)的含量。考虑到预期的镜头概率,结果导致了92.2%的镜头事件的样品纯度。我们发现,当镜头图像之间的最大图像分离大于合成光束尺寸的3倍时,网络结构是最健壮的,并且镜头图像具有至少与20个Sigma(点源)的总磁通密度相等)检测。对于ILT,这对应于爱因斯坦半径大于0.5 ARCSEC和一个无线电源群体的镜头样品,其150 MHz通量密度超过2 MJY。通过应用这些标准和我们的镜头检测算法,我们希望发现Lofar两米天空调查中包含的绝大多数星系尺度重力透镜系统。
translated by 谷歌翻译
随着天文学中检测到的瞬变数量的迅速增加,基于机器学习的分类方法正在越来越多地使用。他们的目标通常是要获得瞬态的确定分类,并且出于良好的性能,他们通常需要存在大量观察。但是,精心设计,有针对性的模型可以通过更少的计算资源来达到其分类目标。本文介绍了Snguess,该模型旨在找到高纯度附近的年轻外乳旋转瞬变。 Snguess可以使用一组功能,这些功能可以从天文警报数据中有效计算。其中一些功能是静态的,并且与警报元数据相关联,而其他功能必须根据警报中包含的光度观测值计算。大多数功能都足够简单,可以在其检测后的瞬态生命周期的早期阶段获得或计算。我们为从Zwicky Transient设施(ZTF)的一组标记的公共警报数据计算了这些功能。 Snguess的核心模型由一组决策树组成,这些集合是通过梯度提升训练的。 SNGUESS建议的候选人中约有88%的ZTF从2020年4月至2021年8月的一组警报中被发现是真正的相关超新星(SNE)。对于具有明亮检测的警报,此数字在92%至98%之间。自2020年4月以来,Snguess确定为ZTF Alert流中潜在SNE的瞬变已发布到AMPEL_ZTF_NEW组标识符下的瞬态名称服务器(TNS)。可以通过Web服务访问ZTF观察到的任何暂时性的SNGUESS分数。 Snguess的源代码可公开使用。
translated by 谷歌翻译
全世界不可持续的捕鱼实践对海洋资源和生态系统构成了重大威胁。识别逃避监测系统的船只(称为“深色船只”)是管理和保护海洋环境健康的关键。随着基于卫星的合成孔径雷达(SAR)成像和现代机器学习(ML)的兴起,现在可以在全天候条件下白天或黑夜自动检测到黑暗的容器。但是,SAR图像需要特定于域的治疗,并且ML社区无法广泛使用。此外,对象(船只)是小而稀疏的,具有挑战性的传统计算机视觉方法。我们提出了用于训练ML模型的最大标记数据集,以检测和表征SAR的血管。 XView3-SAR由Sentinel-1任务中的近1,000张分析SAR图像组成,平均每个29,400 x-24,400像素。使用自动化和手动分析的组合对图像进行注释。每个SAR图像都伴随着共置的测深和风状射手。我们概述了XView3计算机视觉挑战的结果,这是一项国际竞争,使用XView3-SAR进行大规模的船舶检测和表征。我们发布数据(https://iuu.xview.us/)和代码(https://github.com/diux-xview),以支持该重要应用程序的ML方法的持续开发和评估。
translated by 谷歌翻译
众所周知,由于许多空间和时间变化的因素有助于斜率稳定性,因此难以预测滑坡。人工神经网络(ANN)已被证明可以提高预测准确性。但是,传统的ANN是无法解释的,复杂的黑匣子模型。这使得很难在建模区域中提取有关滑坡控制的机械信息,或在此高风险应用中信任结果。在此,我们介绍了可解释的加性神经网络在滑坡易感性建模中的首次应用。我们介绍了一个新的添加剂ANN优化框架,以及新的数据集除法和结果解释技术,适用于使用空间依赖的数据结构(例如滑坡易感性)建模应用程序。我们将我们的方法称为完全可解释性,高精度,高推广性和低模型复杂性作为超固有神经网络(SNN)优化的方法。我们通过培训模型来验证我们的方法,以评估喜马拉雅山脉最容易受到滑坡的三个不同区域的滑坡敏感性。 SNN生成的可解释的神经网络模型胜过基于物理的稳定性和统计模型,并实现了与最先进的深神经网络相似的性能,同时提供了有关滑坡控制因素的相对重要性的见解。 SNN模型发现,斜坡,降水和山坡方面的产物是对研究区域中高压滑敏感性的重要主要因素。这些确定的控件表明,强烈的斜坡气候耦合以及微气候以及在最东部喜马拉雅山的滑坡事件中起主要作用。
translated by 谷歌翻译
Sunquakes are seismic emissions visible on the solar surface, associated with some solar flares. Although discovered in 1998, they have only recently become a more commonly detected phenomenon. Despite the availability of several manual detection guidelines, to our knowledge, the astrophysical data produced for sunquakes is new to the field of Machine Learning. Detecting sunquakes is a daunting task for human operators and this work aims to ease and, if possible, to improve their detection. Thus, we introduce a dataset constructed from acoustic egression-power maps of solar active regions obtained for Solar Cycles 23 and 24 using the holography method. We then present a pedagogical approach to the application of machine learning representation methods for sunquake detection using AutoEncoders, Contrastive Learning, Object Detection and recurrent techniques, which we enhance by introducing several custom domain-specific data augmentation transformations. We address the main challenges of the automated sunquake detection task, namely the very high noise patterns in and outside the active region shadow and the extreme class imbalance given by the limited number of frames that present sunquake signatures. With our trained models, we find temporal and spatial locations of peculiar acoustic emission and qualitatively associate them to eruptive and high energy emission. While noting that these models are still in a prototype stage and there is much room for improvement in metrics and bias levels, we hypothesize that their agreement on example use cases has the potential to enable detection of weak solar acoustic manifestations.
translated by 谷歌翻译
可再生能源的快速开发,尤其是太阳能光伏(PV),对于缓解气候变化至关重要。结果,印度设定了雄心勃勃的目标,可以在2030年之前安装500吉瓦的太阳能容量。鉴于预计大量的足迹可以满足可再生能源能源目标,因此对环境价值的土地利用冲突的潜力很高。为了加快太阳能的发展,土地使用计划者将需要访问PV基础设施的最新,准确的地理空间信息。在这项工作中,我们开发了一种露骨的机器学习模型,以使用自由使用的卫星图像绘制印度的公用事业规模的太阳能项目,平均准确性为92%。我们的模型预测得到了人类专家的验证,以获取1363个太阳能光伏农场的数据集。使用此数据集,我们测量了整个印度的太阳足迹,并量化了与PV基础设施发展相关的土地盖修改程度。我们的分析表明,印度超过74%的太阳能发展是建立在具有自然生态系统保护或农业价值的陆生类型上的。
translated by 谷歌翻译
在本文中,我们使用深度学习模型研究了Charon的陨石坑的大小分布。这是由Singer等人最近的结果动机。 (2019年)使用手动编目发现,直径小于12 km的陨石坑的尺寸分布斜率发生了变化,转化为小柯伊伯带对象的稀少。罗宾斯和歌手(2021)证实了这些结果,但莫比德利等人反对。 (2021),需要进行独立审查。我们基于MaskRCNN的模型合奏经过了Lunar,Mercurian和Martian火山口目录以及光学和数字高程图像的培训。我们使用强大的图像增强方案来迫使模型概括并转移到冰冷的对象中。对于小于10 km的陨石坑,我们的模型没有先前的偏见或接触Charon,因此我们的模型找到了Q = -1.47+-0.33的最佳拟合斜率,而大于15 km的火山口则发现Q = -2.91+-0.51。这些值表明,如Singer等人所建议的那样,斜率明显变化。 (2019年),因此独立确认了他们的结论。然而,我们的斜坡都比Robbins和Singer(2021)最近发现的斜坡稍微更平坦。我们训练有素的模型和相关代码可在github.com/malidib/acid上在线获得。
translated by 谷歌翻译
集中的动物饲养业务(CAFOS)对空气,水和公共卫生构成严重风险,但已被证明挑战规范。美国政府问责办公室注意到基本挑战是缺乏关于咖啡馆的全面的位置信息。我们使用美国农业部的国家农产病程(Naip)1M / Pixel Acial Imagerery来检测美国大陆的家禽咖啡馆。我们培养卷积神经网络(CNN)模型来识别单个家禽谷仓,并将最佳表现模型应用于超过42 TB的图像,以创建家禽咖啡座的第一个国家开源数据集。我们验证了来自加利福尼亚州的10个手标县的家禽咖啡馆设施的模型预测,并证明这种方法具有填补环境监测中差距的显着潜力。
translated by 谷歌翻译
消耗的湖冰是气候变化指标,就像海平面上升或冰川静修一样。监测冰冰物候(LIP)是有用的,因为长期冻结和融化模式充当了哨兵,以了解区域和全球气候变化。我们报告了一项针对瑞士奥伯伦加丁地区的研究,那里有几个中小型山区湖泊。我们从光学卫星图像中观察到唇部事件,例如冻结,分手和冰盖持续时间(2000-2020)。我们通过对这些高山湖泊的湖泊冰层估算有监督的机器学习的空间分辨图来分析MODIS图像的时间序列。为了训练分类器,我们依靠基于网络摄像头图像手动注释的参考数据。从冰图中,我们得出了长期的唇部趋势。由于网络摄像头数据仅适用于两个冬季,因此我们与操作MODIS和VIIRS SNOW PRODUCTS进行了交叉检查结果。我们发现,对于湖泊和西瓦普拉纳(Lakes Sils)和Silvaplana,每年的完全冻结持续时间为-0.76和-0.89天。此外,我们观察到唇部趋势与在附近气象站测得的气候数据的合理相关性。我们注意到,平均冬季空气温度与冻结持续时间和分手事件以及与冻结事件的正相关性具有负相关性。此外,我们观察到在冬季,阳光与冻结持续时间和分手事件之间存在很强的负相关性。
translated by 谷歌翻译
机器学习(ML)是指根据大量数据预测有意义的输出或对复杂系统进行分类的计算机算法。 ML应用于各个领域,包括自然科学,工程,太空探索甚至游戏开发。本文的重点是在化学和生物海洋学领域使用机器学习。在预测全球固定氮水平,部分二氧化碳压力和其他化学特性时,ML的应用是一种有前途的工具。机器学习还用于生物海洋学领域,可从各种图像(即显微镜,流车和视频记录器),光谱仪和其他信号处理技术中检测浮游形式。此外,ML使用其声学成功地对哺乳动物进行了分类,在特定的环境中检测到濒临灭绝的哺乳动物和鱼类。最重要的是,使用环境数据,ML被证明是预测缺氧条件和有害藻华事件的有效方法,这是对环境监测的重要测量。此外,机器学习被用来为各种物种构建许多对其他研究人员有用的数据库,而创建新算法将帮助海洋研究界更好地理解海洋的化学和生物学。
translated by 谷歌翻译
世界上最大的可可生产国C \^ote d'Ivoire and Ghana占全球可可生产的三分之二。在这两个国家,可可都是多年生作物,为近200万农民提供收入。然而,缺少可可种植区域的精确地图,阻碍了保护区,生产和产量的准确量化,并限制了可用于改善可持续性治理的信息。在这里,我们将可可种植园数据与公开可用的卫星图像结合在深度学习框架中,并为两国的可可种植园创建高分辨率地图,并被现场验证。我们的结果表明,可可栽培是C \^ote d'Ivoire和Ghane的保护区中森林损失的37%以上和13%的潜在驱动因素,该官员报告大大低估了种植的地区,最高40%在加纳。这些地图是提高可可生产地区保护和经济发展的关键基础。
translated by 谷歌翻译