在过去的几年中,在深度学习中,在深度学习中广泛研究了域的概括问题,但对对比增强成像的关注受到了有限的关注。但是,临床中心之间的对比度成像方案存在明显差异,尤其是在对比度注入和图像采集之间,而与可用的非对抗成像的可用数据集相比,访问多中心对比度增强图像数据受到限制。这需要新的工具来概括单个中心的深度学习模型,跨越新的看不见的域和临床中心,以对比增强成像。在本文中,我们介绍了深度学习技术的详尽评估,以实现对对比度增强图像分割的看不见的临床中心的普遍性。为此,研究,优化和系统评估了几种技术,包括数据增强,域混合,转移学习和域的适应性。为了证明域泛化对对比增强成像的潜力,评估了对对比增强心脏磁共振成像(MRI)中的心室分割的方法。结果是根据位于三个国家(法国,西班牙和中国)的四家医院中获得的多中心心脏对比增强的MRI数据集获得的。他们表明,数据增强和转移学习的组合可以导致单中心模型,这些模型可以很好地推广到训练过程中未包括的新临床中心。在对比增强成像中,具有合适的概括程序的单域神经网络可以达到甚至超过多中心多供应商模型的性能,从而消除了对综合多中心数据集的需求,以训练可概括的模型。
translated by 谷歌翻译
我们介绍了IST和Unmabel对WMT 2022关于质量估计(QE)的共享任务的共同贡献。我们的团队参与了所有三个子任务:(i)句子和单词级质量预测;(ii)可解释的量化宽松;(iii)关键错误检测。对于所有任务,我们在彗星框架之上构建,将其与OpenKIWI的预测估计架构连接,并为其配备单词级序列标记器和解释提取器。我们的结果表明,在预处理过程中合并参考可以改善下游任务上多种语言对的性能,并且通过句子和单词级别的目标共同培训可以进一步提高。此外,将注意力和梯度信息结合在一起被证明是提取句子级量化量化宽松模型的良好解释的首要策略。总体而言,我们的意见书在几乎所有语言对的所有三个任务中都取得了最佳的结果。
translated by 谷歌翻译
科学机器学习的进步改善了现代计算科学和工程应用。数据驱动的方法(例如动态模式分解(DMD))可以从动态系统生成的时空数据中提取相干结构,并推断上述系统的不同方案。时空数据作为快照,每次瞬间包含空间信息。在现代工程应用中,高维快照的产生可能是时间和/或资源要求。在本研究中,我们考虑了在大型数值模拟中增强DMD工作流程的两种策略:(i)快照压缩以减轻磁盘压力; (ii)使用原位可视化图像在运行时重建动力学(或部分)。我们通过两个3D流体动力学模拟评估我们的方法,并考虑DMD重建解决方案。结果表明,快照压缩大大减少了所需的磁盘空间。我们已经观察到,损耗的压缩将存储降低了几乎$ 50 \%$,而信号重建和其他关注数量的相对错误则较低。我们还使用原位可视化工具将分析扩展到了直接生成的数据,在运行时生成状态向量的图像文件。在大型模拟中,快照的产生可能足够慢,可以使用批处理算法进行推理。流DMD利用增量SVD算法,并随着每个新快照的到来更新模式。我们使用流式DMD来重建原位生成的图像的动力学。我们证明此过程是有效的,并且重建的动力学是准确的。
translated by 谷歌翻译
我们研究了图结构识别的问题,即在时间序列之间恢复依赖图的图。我们将这些时间序列数据建模为线性随机网络动力学系统状态的组成部分。我们假设部分可观察性,其中仅观察到一个包含网络的节点子集的状态演变。我们设计了一个从观察到的时间序列计算的新功能向量,并证明这些特征是线性可分离的,即存在一个超平面,该超平面将与连接的节点成对相关的特征群体与与断开对相关的节点相关联。这使得可以训练各种分类器进行因果推理的功能。特别是,我们使用这些功能来训练卷积神经网络(CNN)。由此产生的因果推理机制优于最先进的W.R.T.样品复杂性。受过训练的CNN概括了结构上不同的网络(密集或稀疏)和噪声级别的轮廓。值得注意的是,他们在通过合成网络(随机图的实现)训练时也很好地概括了现实世界网络。最后,提出的方法始终以成对的方式重建图,也就是说,通过确定每对相应的时间序列中的每对节点中是否存在边缘或箭头或不存在箭头。这符合大规模系统的框架,在该系统中,网络中所有节点的观察或处理都令人难以置信。
translated by 谷歌翻译
近年来,机器学习算法在多种高风险决策应用程序中变得无处不在。机器学习算法从数据中学习模式的无与伦比的能力也使它们能够融合嵌入的偏差。然后,一个有偏见的模型可以做出不成比例地损害社会中某些群体的决策 - 例如,他们获得金融服务的机会。对这个问题的认识引起了公平ML领域,该领域的重点是研究,衡量和缓解算法预测的不公平性,相对于一组受保护的群体(例如种族或性别)。但是,算法不公平的根本原因仍然难以捉摸,研究人员在指责ML算法或训练的数据之间进行了划分。在这项工作中,我们坚持认为,算法不公平源于数据中模型与偏见之间的相互作用,而不是源于其中任何一个的孤立贡献。为此,我们提出了一种分类法来表征数据偏差,并研究了一系列关于公平盲目的ML算法在不同数据偏见设置下表现出的公平性准确性权衡的假设。在我们的现实帐户开放欺诈用例中,我们发现每个设置都需要特定的权衡,从而影响了预期价值和差异的公平性 - 后者通常没有注意到。此外,我们展示了算法在准确性和公平性方面如何根据影响数据的偏差进行比较。最后,我们注意到,在特定的数据偏见条件下,简单的预处理干预措施可以成功平衡小组错误率,而在更复杂的设置中相同的技术失败。
translated by 谷歌翻译
我们证明了Yolov5模型(一种基于通用卷积的单杆对象检测模型)的应用,在从当前生成干涉仪检测器的重力数据中检测到二进制中子星(BNS)聚合事件的任务。我们还基于用于模型训练,验证和测试步骤的大概波形模型对合成数据生成和准备任务的详尽说明。使用这种方法,我们实现平均平均精度($ \ text {map} _ {[0.50]} $)的单个类验证数据集的值为0.945,测试数据集的平均值为0.945,高达0.978。此外,训练有素的模型成功地识别了LIGO H1检测器数据中的GW170817事件。 LIGO L1检测器数据也可以通过附加的预处理步骤进行识别,而无需在Inspiral的最后阶段消除大故障。 GW190425事件的检测不太成功,这证明了信噪比的性能退化。我们的研究表明,Yolov5模型是第一阶段检测警报管道的有趣方法,并且在整合到更复杂的管道中时,用于实时推断物理源参数。
translated by 谷歌翻译
这项工作提出了一种用于参与感测的无线传感器网络的提议,其中IOT传感装置特别用于监测和预测空气质量,作为高成本气象站的替代方案。该系统称为PMSening,旨在测量颗粒材料。通过将原型收集的数据与来自车站的数据进行比较来完成验证。比较表明,结果是关闭的,这可以为问题提供低成本解决方案。该系统仍然呈现了使用反复性神经网络的预测分析,在这种情况下,在这种情况下,预测呈现与实际数据相关的高精度。
translated by 谷歌翻译
预测基于图的时间依赖性数据具有许多实际应用。此任务具有挑战性,因为模型不仅需要捕获数据中的空间依赖性和时间依赖性,而且还需要利用有用的辅助信息来进行准确的预测。在本文中,我们分析了最新模型对处理时间依赖性的局限性。为了解决此限制,我们提出了GSA-Forecaster,这是一种用于预测基于图的时间相关数据的新的深度学习模型。 GSA-Forecaster利用图形序列注意(GSA)是本文提出的一种新的注意机制,用于有效捕获时间依赖性。 GSA-Forecaster将数据的图结构嵌入其架构中,以解决空间依赖性。 GSA-ForeCaster还占用辅助信息,以进一步改善预测。我们通过基于大型现实图的时间依赖性数据评估GSA-Forecaster,并证明了其对最先进模型的有效性,该模型具有6.7%的RMSE和5.8%的MAPE降低。
translated by 谷歌翻译
深度学习在识别视频行动方面取得了巨大成功,但培训数据的收集和注释仍然相当艰苦,这主要是两个方面:(1)所需的注释数据量大; (2)在临时注释每个动作的位置是耗时的。已经提出了诸如少量学习或未过时的视频识别等工作以处理一个方面或另一个方面。但是,很少有现有工程可以同时处理这两个问题。在本文中,我们针对一个新的问题,注释高效的视频识别,以减少对大量样本和动作位置的注释要求。这种问题由于两个方面而挑战:(1)未经监测的视频仅具有薄弱的监督; (2)与当前利益行动(背景,BG)无关的视频段可能包含新颖类别中的利益(前景,FG)的行动,这是一种广泛存在的现象,但很少在少量未经监测的视频识别中进行了研究。为了实现这一目标,通过分析BG的属性,我们将BG分类为信息BG(IBG)和非信息性BG(NBG),并提出(1)基于开放式检测的方法来找到NBG和FG, (2)一种对比学习方法,用于学习IBG,以自我监督方式区分NBG,(3)用于更好地区的IBG和FG的自我加权机制。关于ActivityNet V1.2和ActivityNet V1.3的广泛实验验证了所提出的方法的理由和有效性。
translated by 谷歌翻译
现有的几次拍摄学习(FSL)方法通常假设基类和新颖类来自同一域(域名设置)。然而,在实践中,为某些特殊域收集足够的训练样本可能是不可行的,以构建基础类别。为了解决这个问题,最近提出了跨域FSL(CDFSL),以将来自普通域库类的知识传输到特殊域新颖类。现有的CDFSL主要关注在域之间传输,虽然很少考虑在遥远的域之间转移,这是任何新颖的类都可以出现在现实世界中的任何新的课程中,并且更具挑战性。在本文中,我们研究了CDFSL的具有挑战性的子集,其中新颖类别通过重新审视中级特征来从基础类别中的遥远域名,在主流FSL工作中更为可转让尚未转换。为了提高中级特征的可辨性,我们提出了一种剩余预测任务,以鼓励中级特征来学习每个样本的辨别信息。值得注意的是,这种机制也使域内FSL和CDFSL达到域附近。因此,我们在相同的训练框架下分别为交叉和域FSL提供两种类型的功能。在六个公共数据集中的两个设置下的实验,包括两个具有挑战性的医疗数据集,验证了我们的理由并展示了最先进的表现。代码将被释放。
translated by 谷歌翻译