智能论文笔记

Unsupervised Extractive Summarization with Heterogeneous Graph Embeddings for Chinese Document

Chen Lin , Ye Liu , Siyu An , Di Yin

分类：自然语言处理

2022-11-09

In the scenario of unsupervised extractive summarization, learning high-quality sentence representations is essential to select salient sentences from the input document. Previous studies focus more on employing statistical approaches or pre-trained language models (PLMs) to extract sentence embeddings, while ignoring the rich information inherent in the heterogeneous types of interaction between words and sentences. In this paper, we are the first to propose an unsupervised extractive summarizaiton method with heterogeneous graph embeddings (HGEs) for Chinese document. A heterogeneous text graph is constructed to capture different granularities of interactions by incorporating graph structural information. Moreover, our proposed graph is general and flexible where additional nodes such as keywords can be easily integrated. Experimental results demonstrate that our method consistently outperforms the strong baseline in three summarization datasets.

translated by 谷歌翻译

Structure Guided Manifolds for Discovery of Disease Characteristics

Siyu Liu , Linfeng Liu , Fatima Nasrallah , Craig Engstrom , Stuart Crozier , Shekhar Chandra

分类：计算机视觉

2022-09-22

在医学图像分析中，许多疾病的微妙视觉特征要具有挑战性，尤其是由于缺乏配对数据。例如，在温和的阿尔茨海默氏病（AD）中，很难从纯成像数据中观察到脑组织萎缩，尤其是没有配对的AD和认知正常（CN）数据以进行比较。这项工作介绍了疾病发现甘（Didigan），这是一种基于弱的基于风格的框架，可发现和可视化细微的疾病特征。 Didigan了解了AD和CN视觉特征的疾病歧管，并将此歧管采样的样式代码施加到解剖结构“蓝图”上，以综合配对AD和CN磁共振图像（MRIS）。为了抑制生成的AD和CN对之间的非疾病相关变化，Didigan利用具有循环一致性和抗偏置的结构约束来实施解剖对应关系。当对阿尔茨海默氏病神经影像学计划（ADNI）数据集进行测试时，Didigan通过合成的配对AD和CN扫描显示了关键的AD特征（减少海马体积，心室增大和皮质结构的萎缩）。定性结果通过自动化的大脑体积分析来支持，其中还测量了脑组织结构的系统成对降低

translated by 谷歌翻译

Towards Label-efficient Automatic Diagnosis and Analysis: A Comprehensive Survey of Advanced Deep Learning-based Weakly-supervised, Semi-supervised and Self-supervised Techniques in Histopathological Image Analysis

Linhao Qu , Siyu Liu , Xiaoyu Liu , Manning Wang , Zhijian Song

分类：计算机视觉

2022-08-18

组织病理学图像包含丰富的表型信息和病理模式，这是疾病诊断的黄金标准，对于预测患者预后和治疗结果至关重要。近年来，在临床实践中迫切需要针对组织病理学图像的计算机自动化分析技术，而卷积神经网络代表的深度学习方法已逐渐成为数字病理领域的主流。但是，在该领域获得大量细粒的注释数据是一项非常昂贵且艰巨的任务，这阻碍了基于大量注释数据的传统监督算法的进一步开发。最新的研究开始从传统的监督范式中解放出来，最有代表性的研究是基于弱注释，基于有限的注释的半监督学习范式以及基于自我监督的学习范式的弱监督学习范式的研究图像表示学习。这些新方法引发了针对注释效率的新自动病理图像诊断和分析。通过对130篇论文的调查，我们对从技术和方法论的角度来看，对计算病理学领域中有关弱监督学习，半监督学习以及自我监督学习的最新研究进行了全面的系统综述。最后，我们提出了这些技术的关键挑战和未来趋势。

translated by 谷歌翻译

Tackling Data Scarcity with Transfer Learning: A Case Study of Thickness Characterization from Optical Spectra of Perovskite Thin Films

Siyu Isaac Parker Tian , Zekun Ren , Selvaraj Venkataraj , Yuanhang Cheng , Daniil Bash , Felipe Oviedo , J. Senthilnath , Vijila Chellappan , Yee-Fun Lim , Armin G. Aberle

分类：机器学习

2022-06-14

Transfer learning increasingly becomes an important tool in handling data scarcity often encountered in machine learning. In the application of high-throughput thickness as a downstream process of the high-throughput optimization of optoelectronic thin films with autonomous workflows, data scarcity occurs especially for new materials. To achieve high-throughput thickness characterization, we propose a machine learning model called thicknessML that predicts thickness from UV-Vis spectrophotometry input and an overarching transfer learning workflow. We demonstrate the transfer learning workflow from generic source domain of generic band-gapped materials to specific target domain of perovskite materials, where the target domain data only come from limited number (18) of refractive indices from literature. The target domain can be easily extended to other material classes with a few literature data. Defining thickness prediction accuracy to be within-10% deviation, thicknessML achieves 92.2% (with a deviation of 3.6%) accuracy with transfer learning compared to 81.8% (with a deviation of 3.6%) 11.7% without (lower mean and larger standard deviation). Experimental validation on six deposited perovskite films also corroborates the efficacy of the proposed workflow by yielding a 10.5% mean absolute percentage error (MAPE).

translated by 谷歌翻译

An Efficient End-to-End 3D Voxel Reconstruction based on Neural Architecture Search

Yongdong Huang , Yuanzhan Li , Xulong Cao , Siyu Zhang , Shen Cai , Ting Lu , Jie Wang , Yuqi Liu

分类：计算机视觉

2022-02-27

使用神经网络代表3D对象已变得流行。但是，许多以前的作品采用具有固定体系结构和大小的神经网络来表示不同的3D对象，这导致简单对象的网络参数过多，并且对复杂对象的重建精度有限。对于每个3D模型，希望拥有尽可能少的参数以实现高保真重建的端到端神经网络。在本文中，我们提出了一种利用神经体系结构搜索（NAS）和二进制分类的高效体素重建方法。以层数，每一层的节点数量以及每一层的激活函数为搜索空间，可以根据强化学习技术获得特定的网络体系结构。此外，为了摆脱网络推理后使用的传统表面重建算法（例如，行进立方体），我们通过对二进制体素进行分类来完成端到端网络。与其他签名的距离字段（SDF）预测或二进制分类网络相比，我们的方法使用更少的网络参数获得了更高的重建精度。

translated by 谷歌翻译

ERNIE 3.0 Titan: Exploring Larger-scale Knowledge Enhanced Pre-training for Language Understanding and Generation

Shuohuan Wang , Yu Sun , Yang Xiang , Zhihua Wu , Siyu Ding , Weibao Gong , Shikun Feng , Junyuan Shang , Yanbin Zhao , Chao Pang

分类：自然语言处理

2021-12-23

预先接受的语言模型实现了最先进的导致各种自然语言处理（NLP）任务。 GPT-3表明，缩放预先训练的语言模型可以进一步利用它们的巨大潜力。最近提出了一个名为Ernie 3.0的统一框架，以预先培训大型知识增强型号，并培训了具有10亿参数的模型。 Ernie 3.0在各种NLP任务上表现出最先进的模型。为了探讨缩放的表现，我们培养了百卢比的3.0泰坦参数型号，在PaddlePaddle平台上有高达260亿参数的泰坦。此外，我们设计了一种自我监督的对抗性损失和可控语言建模损失，以使ERNIE 3.0 TITAN产生可信和可控的文本。为了减少计算开销和碳排放，我们向Ernie 3.0泰坦提出了一个在线蒸馏框架，教师模型将同时教授学生和培训。埃塞尼3.0泰坦是迄今为止最大的中国密集预训练模型。经验结果表明，Ernie 3.0泰坦在68个NLP数据集中优于最先进的模型。

translated by 谷歌翻译

GB-CosFace: Rethinking Softmax-based Face Recognition from the Perspective of Open Set Classification

Lizhe Liu , Mingqiang Chen , Xiaohao Chen , Siyu Zhu , Ping Tan

分类：计算机视觉

2021-11-22

最先进的面部识别方法通常采用多分类管道，并采用基于SoftMax的损耗进行优化。虽然这些方法取得了巨大的成功，但基于Softmax的损失在开放式分类的角度下有其限制：训练阶段的多分类目标并没有严格匹配开放式分类测试的目标。在本文中，我们派生了一个名为全局边界Cosface的新损失（GB-Cosface）。我们的GB-COSface介绍了自适应全局边界，以确定两个面积是否属于相同的身份，使得优化目标与从开放集分类的角度与测试过程对齐。同时，由于损失配方来自于基于软MAX的损失，因此我们的GB-COSFace保留了基于软MAX的损耗的优异性能，并且证明了COSFace是拟议损失的特殊情况。我们在几何上分析并解释了所提出的GB-Cosface。多面识别基准测试的综合实验表明，所提出的GB-Cosface优于主流面部识别任务中的当前最先进的面部识别损失。与Cosface相比，我们的GB-Cosface在Tar @ Far = 1E-6，1E-5，1E-4上提高了1.58％，0.57％和0.28％的IJB-C基准。

translated by 谷歌翻译

INTERN: A New Learning Paradigm Towards General Vision

Jing Shao , Siyu Chen , Yangguang Li , Kun Wang , Zhenfei Yin , Yinan He , Jianing Teng , Qinghong Sun , Mengya Gao , Jihao Liu

分类：计算机视觉 | 人工智能 | 机器学习

2021-11-16

过去几年的技术创新的巨大浪潮，标志着AI技术的进展，是深刻的重塑行业和社会。然而，在路上，一个关键的挑战等待着我们，即我们满足快速增长的情景的能力的能力受到收购培训数据的成本的严重限制。由于主流学习范式的局限性，这一困难的局面是基于主流学习范式的局限性：我们需要根据大量注释的数据以及通常从头来训练每个新场景的新模型。在解决这一基本问题时，我们超越并开发一个名为实习生的新学习范式。通过在多个阶段的来自多个来源的监控信号学习，培训的模型将产生强大的相互性。我们在26个众所周知的数据集中评估我们的模型，该数据集涵盖计算机视觉中的四类任务。在大多数情况下，我们的模型仅适用于目标域中的培训数据的10％，始终以完整的数据培训的对应物，通常由显着的边距。这是一个重要前景的重要一步，其中具有一般视觉能力的这种模型可以大大降低对数据的依赖，从而加速通过AI技术的采用。此外，围绕我们的新范式旋转，我们还介绍了一个新的数据系统，新的架构和新的基准，以及一起形成一般愿景生态系统，以开放和包容性的方式支持其未来的发展。

translated by 谷歌翻译

FINO: Flow-based Joint Image and Noise Model

Lanqing Guo , Siyu Huang , Haosen Liu , Bihan Wen

分类：计算机视觉

2021-11-11

图像恢复中的一个根本挑战是去噪，目标是从其嘈杂的测量中估计清洁图像。为了解决这种不良反对问题，现有的去噪方法通常专注于利用有效的自然图像前提。噪声模型的利用和分析通常被忽略，尽管噪声模型可以向去噪算法提供互补信息。在本文中，我们提出了一种新的流基的联合图像和噪声模型（Fino），其明显地与潜在空间中的图像和噪声分离，并且无损地通过一系列可逆的转换来重建它们。我们进一步提出了一种可变交换策略，以对准图像的结构信息和噪声相关矩阵，以基于空间最小化相关信息来限制噪声。实验结果表明，Fino去除合成添加剂白高斯噪声（AWGN）和真实噪音的能力。此外，铜的概括到除去空间变体噪声和具有不准确估计的噪声的噪声超越了大幅边缘的流行和最先进的方法。

translated by 谷歌翻译

Cluster Contrast for Unsupervised Person Re-Identification

Zuozhuo Dai , Guangyuan Wang , Weihao Yuan , Xiaoli Liu , Siyu Zhu , Ping Tan

分类：计算机视觉

2021-03-22

最先进的无监督的RE-ID方法使用基于内存的非参数软制AX丢失训练神经网络。存储在存储器中的实例特征向量通过群集和更新在实例级别中分配伪标签。然而，不同的簇大小导致每个群集的更新进度中的不一致。为了解决这个问题，我们呈现了存储特征向量的集群对比度，并计算群集级别的对比度损耗。我们的方法采用唯一的群集表示来描述每个群集，从而产生群集级存储字典。以这种方式，可以有效地保持聚类的一致性，在整个阶段，可以显着降低GPU存储器消耗。因此，我们的方法可以解决集群不一致的问题，并且适用于较大的数据集。此外，我们采用不同的聚类算法来展示我们框架的鲁棒性和泛化。与标准无监督的重新ID管道的集群对比的应用达到了9.9％，8.3％，12.1％的显着改善，而最新的无人纯粹无监督的重新ID方法和5.5％，4.8％，4.4％地图相比与市场，公爵和MSMT17数据集上的最先进的无监督域适应重新ID方法相比。代码可在https://github.com/alibaba/cluster-contrast获得。

translated by 谷歌翻译