信息理论措施已广泛采用学习和决策问题的特征。受到这一点的启发,我们介绍了Shannon Sense的信息损失的弱形式,ii)在考虑一系列有损的连续表示(特征)时,错误(MPE)意义上的最小概率的操作损失连续观察。我们展示了几个结果揭示了这种相互作用的结果。我们的第一个结果在采用离散的损耗表示(量化)而不是原始原始观察时,在其各自的操作损失的函数中提供弱的信息损失形式的下限。从这后,我们的主要结果表明,在考虑一般的持续陈述时,特定形式的消失信息丧失(渐近信息充足的弱势概念)意味着消失的MPE损失(或渐近运营充足机会)。我们的理论调查结果支持观察到选择要捕捉信息充足性的特征表示是适当的学习,但如果预期目标在分类中实现MPE,这种选择是一种相当保守的设计原则。支持这一表明,在某些结构条件下,我们表明,可以采取信息充足的替代概念(严格弱于互信息意义上的纯粹足够的充足),以实现运动充足。
translated by 谷歌翻译
研究人员通常会采用数值方法来理解和预测海洋动力学,这是掌握环境现象的关键任务。在地形图很复杂,有关基础过程的知识不完整或应用程序至关重要的情况下,此类方法可能不适合。另一方面,如果观察到海洋动力学,则可以通过最近的机器学习方法来利用它们。在本文中,我们描述了一种数据驱动的方法,可以预测环境变量,例如巴西东南海岸的Santos-Sao Vicente-Bertioga estuarine系统的当前速度和海面高度。我们的模型通过连接最新的序列模型(LSTM和Transformers)以及关系模型(图神经网络)来利用时间和空间归纳偏见,以学习时间特征和空间特征,观察站点之间共享的关系。我们将结果与桑托斯运营预测系统(SOFS)进行比较。实验表明,我们的模型可以实现更好的结果,同时保持灵活性和很少的领域知识依赖性。
translated by 谷歌翻译
神经网络体系结构的定义是执行最关键和最具挑战性的任务之一。在本文中,我们提出了平行密码。ParallelMLPS是一种可以通过探索现代CPU和GPU的局部性和并行功能的原理来实现具有不同数量神经元和激活功能的几个独立多层感知神经网络的训练。该技术的核心思想是使用修改的矩阵乘法,该矩阵乘法将序数矩阵乘法替换为两个简单的矩阵操作,这些矩阵操作允许梯度流动的单独且独立的路径,可以在其他情况下使用。我们已经在模拟数据集中评估了我们的算法,该数据集使用10,000种不同的模型来改变样品,功能和批次的数量。如果与顺序方法相比,我们实现了从1到4个数量级的训练速度。
translated by 谷歌翻译
有必要开发负担得起且可靠的诊断工具,该工具允许包含COVID-19的扩散。已经提出了机器学习(ML)算法来设计支持决策系统以评估胸部X射线图像,事实证明,这些图像可用于检测和评估疾病进展。许多研究文章围绕此主题发表,这使得很难确定未来工作的最佳方法。本文介绍了使用胸部X射线图像应用于COVID-19检测的ML的系统综述,旨在就方法,体系结构,数据库和当前局限性为研究人员提供基线。
translated by 谷歌翻译
卷积神经网络越来越多地用于关键系统,在这些系统中,确保其稳健性和对齐方式至关重要。在这种情况下,可解释的人工智能领域提出了通过概念提取的高级解释产生。这些方法检测到图像中是否存在概念,但无法找到位置。此外,由于缺少适当的验证程序,因此很难对方法进行公平的比较。为了填补这些空白,我们根据通过CNN的激活图获得的表示,提出了一种新的方法来自动概念提取和定位。此外,我们介绍了一个基于合成数据集验证概念抽取技术的过程,并通过像素的主要成分进行像素注释,从而减少了人类干预。通过对合成数据集和现实世界数据集进行广泛的实验,与最先进的替代方案相比,我们的方法取得了更好的性能。
translated by 谷歌翻译
我们研究了仅当仅可用的嘈杂数据时,重建神经网络反问题的解决方案的问题。我们假设问题可以用无限可逆的无限前向操作员建模。然后,我们将该正向操作员限制为有限维空间,以使逆向Lipschitz连续。对于逆操作员,我们证明存在一个神经网络,该神经网络是操作员的健壮到噪声近似。此外,我们表明可以从适当的干扰培训数据中学到这些神经网络。我们证明了这种方法对实践感兴趣的各种反向问题的可接受性。给出了支持理论发现的数值示例。
translated by 谷歌翻译
在科学和工程的几个领域,识别化合物至关重要。基于激光的技术对于自主化合物检测很有希望,因为材料的光学响应编码了足够的电子和振动信息,以供远程化学识别。使用红外吸收光谱的指纹区域对此进行了利用,后者涉及一组密集的吸收峰,这些吸收峰是单个分子独有的,从而促进化学鉴定。但是,尚未实现使用可见光的光学识别。在从紫外线到远红外的纯有机化合物和聚合物的科学文献中,使用数十年的实验折射率数据,我们开发了一个机器学习分类器,该分类器可以基于单波长准确地识别有机物种可见光谱区域的色散测量,远离吸收共振。这里提出的光学分类器可以应用于自主材料识别协议或应用程序。
translated by 谷歌翻译
尽管在文本到语音综合的生成建模方面取得了最新进展,但这些模型尚未具有与螺距条件确定性模型(例如FastPitch和fastspeech2)相同的细粒度可调节性。音调信息不仅是低维度,而且是不连续的,这使得在生成环境中建模特别困难。我们的工作探讨了在正常流量模型的背景下处理上述问题的几种技术。我们还发现这个问题非常适合神经条件流,这是归一化流中更常见的仿射耦合机制的高度表达替代品。
translated by 谷歌翻译
通常,基于生物谱系的控制系统可能不依赖于各个预期行为或合作适当运行。相反,这种系统应该了解未经授权的访问尝试的恶意程序。文献中提供的一些作品建议通过步态识别方法来解决问题。这些方法旨在通过内在的可察觉功能来识别人类,尽管穿着衣服或配件。虽然该问题表示相对长时间的挑战,但是为处理问题的大多数技术存在与特征提取和低分类率相关的几个缺点,以及其他问题。然而,最近的深度学习方法是一种强大的一组工具,可以处理几乎任何图像和计算机视觉相关问题,为步态识别提供最重要的结果。因此,这项工作提供了通过步态认可的关于生物识别检测的最近作品的调查汇编,重点是深入学习方法,强调他们的益处,暴露出弱点。此外,它还呈现用于解决相关约束的数据集,方法和体系结构的分类和表征描述。
translated by 谷歌翻译
随着全球气候变化影响影响世界的影响,需要集体努力来减少温室气体排放。能源部门是气候变化的最大贡献者,许多努力集中在减少对碳源发电厂的依赖,并转向可再生能源,如太阳能。太阳能电池板位置的全面数据库对于协助分析师和政策制定者来说,在定义太阳能的进一步扩展方面的策略方面很重要。在本文中,我们专注于创建太阳能电池板的世界地图。我们识别给定地理区域内的太阳能电池板的位置和总表面积。我们使用深度学习方法来使用空中图像自动检测太阳能电池板位置及其表面积。该框架由使用具有语义分割模型的串联串联使用图像分类器的双分支模型组成的框架在我们创建的卫星图像的日数据集上培训。我们的作品提供了一种用于检测太阳能电池板的高效和可扩展的方法,实现分类的精度为0.96,并且对于分割性能,IOU分数为0.82。
translated by 谷歌翻译