Image enhancement is a technique that frequently utilized in digital image processing. In recent years, the popularity of learning-based techniques for enhancing the aesthetic performance of photographs has increased. However, the majority of current works do not optimize an image from different frequency domains and typically focus on either pixel-level or global-level enhancements. In this paper, we propose a transformer-based model in the wavelet domain to refine different frequency bands of an image. Our method focuses both on local details and high-level features for enhancement, which can generate superior results. On the basis of comprehensive benchmark evaluations, our method outperforms the state-of-the-art methods.
translated by 谷歌翻译
The identification of addiction-related circuits is critical for explaining addiction processes and developing addiction treatments. And models of functional addiction circuits developed from functional imaging are an effective tool for discovering and verifying addiction circuits. However, analyzing functional imaging data of addiction and detecting functional addiction circuits still have challenges. We have developed a data-driven and end-to-end generative artificial intelligence(AI) framework to address these difficulties. The framework integrates dynamic brain network modeling and novel network architecture networks architecture, including temporal graph Transformer and contrastive learning modules. A complete workflow is formed by our generative AI framework: the functional imaging data, from neurobiological experiments, and computational modeling, to end-to-end neural networks, is transformed into dynamic nicotine addiction-related circuits. It enables the detection of addiction-related brain circuits with dynamic properties and reveals the underlying mechanisms of addiction.
translated by 谷歌翻译
Shadow removal improves the visual quality and legibility of digital copies of documents. However, document shadow removal remains an unresolved subject. Traditional techniques rely on heuristics that vary from situation to situation. Given the quality and quantity of current public datasets, the majority of neural network models are ill-equipped for this task. In this paper, we propose a Transformer-based model for document shadow removal that utilizes shadow context encoding and decoding in both shadow and shadow-free regions. Additionally, shadow detection and pixel-level enhancement are included in the whole coarse-to-fine process. On the basis of comprehensive benchmark evaluations, it is competitive with state-of-the-art methods.
translated by 谷歌翻译
在线行动检测旨在基于长期的历史观察结果对当前框架进行准确的行动预测。同时,它需要对在线流视频进行实时推断。在本文中,我们主张一个新颖有效的在线行动检测原则。它仅在一个窗口中更新最新,最古老的历史表示,但重复了已经计算的中间图表。基于这一原则,我们引入了一个基于窗口的级联变压器,带有圆形历史队列,在每个窗口上都进行了多阶段的注意力和级联精炼。我们还探讨了在线操作检测与其脱机行动分段作为辅助任务之间的关联。我们发现,这种额外的监督有助于判别历史的聚类,并充当功能增强,以更好地培训分类器和级联改善。我们提出的方法在三个具有挑战性的数据集Thumos'14,TVSeries和HDD上实现了最新的表演。接受后将可用。
translated by 谷歌翻译
相关神经回路的功能改变是在一定时期的药物成瘾中发生的。这些重大变化也通过分析fMRI揭示。然而,由于fMRI的高维度和信噪比差,因此对于图形识别和尼古丁成瘾(NA)和健康控制之间的图形识别和区域级生物标志物检测任务编码有效且健壮的大脑区域嵌入是一项挑战。 HC)组。在这项工作中,我们将大鼠脑的fMRI表示为具有生物学属性的图形,并提出了一种新型特征选择的图形空间注意网络(FGSAN),以提取成瘾的生物标志物并从这些大脑网络中识别。特别是,使用图形空间注意编码器来捕获具有空间信息的时空脑网络的特征。该方法同时采用贝叶斯特征选择策略,以通过约束功能来优化模型并改善分类任务。与成瘾相关的神经成像数据集进行的实验表明,所提出的模型可以获得卓越的性能并检测与成瘾的神经回路相关的可解释的生物标志物。
translated by 谷歌翻译
不同类型的神经影像数据的跨模式融合显示了预测阿尔茨海默氏病(AD)进展的巨大希望。但是,在神经成像中应用的大多数现有方法无法有效地融合来自多模式神经图像的功能和结构信息。在这项工作中,提出了一种新型的跨模式变压器生成对抗网络(CT-GAN),以融合包含在静止状态功能磁共振成像(RS-FMRI)中的功能信息(RS-FMRI),并包含在扩散张量图像(DTI)中包含的结构信息。开发的双重注意机制可以有效地匹配功能信息,并最大程度地提高从RS-FMRI和DTI提取互补信息的能力。通过捕获结构特征和功能特征之间的深层互补信息,提出的CT-GAN可以检测到与AD相关的大脑连接性,可以用作AD的生物标志物。实验结果表明,所提出的模型不仅可以改善分类性能,而且还可以有效地检测与广告相关的大脑连接性。
translated by 谷歌翻译
诊断阿尔茨海默病(AD)的早期阶段(AD)对于及时治疗至关重要以缓慢进一步恶化。可视化广告早期阶段的形态特征是巨大的临床价值。在这项工作中,提出了一种新的多向感知生成的对抗网络(MP-GaN)来可视化表明不同阶段患者的广告严重程度的形态特征。具体地,通过将​​新的多向映射机制引入模型中,所提出的MP-GaN可以有效地捕获突出全局特征。因此,通过利用来自发电机的类别辨别图,所提出的模型可以通过源域和预定义目标域之间的MR图像变换清楚地描绘微妙的病变。此外,通过集成对抗性损失,分类损失,周期一致性损失和\ emph {l} 1惩罚,MP-GaN中的单个发电机可以学习多类的类鉴别映射。对阿尔茨海默病神经影像倡议(ADNI)数据集进行了广泛的实验结果表明,与现有方法相比,MP-GAN实现了卓越的性能。由MP-GaN可视化的病变也与临床医人观察到的一致。
translated by 谷歌翻译
最先进的深度学习方法在分割任务中表现出令人印象深刻的性能。然而,这些方法的成功取决于大量手动标记的掩模,这是昂贵且耗时的收集。在这项工作中,提出了一种新的一致性感知的对抗网络(Cpgan),用于半监督卒中病变细分。拟议的CPGAN可以减少对完全标记的样品的依赖。具体地,设计相似性连接模块(SCM)以捕获多尺度特征的信息。所提出的SCM可以通过加权和选择性地聚合每个位置处的特征。此外,将一致的感知策略引入所提出的模型中,以增强脑卒中病变预测对未标记数据的影响。此外,构建助理网络以鼓励鉴别者学习在训练阶段期间经常被遗忘的有意义的特征表示。助理网络和鉴别者用于共同决定分割结果是否是真实的或假的。 CPGAN在中风(ATLAS)后病变的解剖学描记。实验结果表明,所提出的网络实现了卓越的分割性能。在半监督分割任务中,使用只有五分之二的标记样本的建议的CPGAN优于使用完整标记样本的一些方法。
translated by 谷歌翻译
各种网络的部署(例如,事物互联网(IOT)和移动网络),数据库(例如,营养表和食品组成数据库)和社交媒体(例如,Instagram和Twitter)产生大量的多型食品数据,这在食品科学和工业中起着关键作用。然而,由于众所周知的数据协调问题,这些多源食品数据显示为信息孤岛,导致难以充分利用这些食物数据。食物知识图表提供了统一和标准化的概念术语及其结构形式的关系,因此可以将食物信息孤单转换为更可重复使用的全球数量数字连接的食物互联网以使各种应用有益。据我们所知,这是食品科学与工业中食品知识图表的第一个全面审查。我们首先提供知识图表的简要介绍,然后主要从食物分类,食品本体到食品知识图表的进展。粮食知识图表的代表性应用将在新的配方开发,食品可追溯性,食物数据可视化,个性化饮食推荐,食品搜索和质询回答,视觉食品对象识别,食品机械智能制造方面来概述。我们还讨论了该领域的未来方向,例如食品供应链系统和人类健康的食品知识图,这应该得到进一步的研究。他们的巨大潜力将吸引更多的研究努力,将食物知识图形应用于食品科学和工业领域。
translated by 谷歌翻译
优化平均精度(AP)的近似已被广泛研究图像检索。受AP的定义有限,这些方法考虑在每个阳性实例之前的负数和正面情况。但是,我们声称只在积极的情况下惩罚负面情况,因为损失只来自这些负面情况。为此,我们提出了一种新的损失,即惩罚正面(PNP)的负面情况,这可以直接最小化每个正面前的负实例的数量。此外,基于AP的方法采用固定和次优梯度分配策略。因此,我们通过构建损耗的衍生功能来系统地调查不同的梯度分配解决方案,导致PNP-I具有增加的衍生函数和PNP-D,其具有减小的函数。 PNP-I通过为它们分配更大的渐变并尝试使所有相关实例更近的较大渐变来重点缩影。相比之下,PNP-D对此类实例的关注不那么注意,并慢慢纠正它们。对于大多数真实世界的数据,一类通常包含几个本地群集。 PNP-我盲目地聚集了这些群集,而PNP-D保持它们。因此,PNP-D更优越。三个标准检索数据集的实验显示了上述分析的一致结果。广泛的评估表明PNP-D实现了最先进的性能。代码在https://github.com/interestingzhuo/pnp_loss获得
translated by 谷歌翻译