智能论文笔记

Robust Consensus Clustering and its Applications for Advertising Forecasting

Deguang Kong , Miao Lu , Konstantin Shmakov , Jian Yang

分类：机器学习 | 人工智能

2022-12-27

Consensus clustering aggregates partitions in order to find a better fit by reconciling clustering results from different sources/executions. In practice, there exist noise and outliers in clustering task, which, however, may significantly degrade the performance. To address this issue, we propose a novel algorithm -- robust consensus clustering that can find common ground truth among experts' opinions, which tends to be minimally affected by the bias caused by the outliers. In particular, we formalize the robust consensus clustering problem as a constraint optimization problem, and then derive an effective algorithm upon alternating direction method of multipliers (ADMM) with rigorous convergence guarantee. Our method outperforms the baselines on benchmarks. We apply the proposed method to the real-world advertising campaign segmentation and forecasting tasks using the proposed consensus clustering results based on the similarity computed via Kolmogorov-Smirnov Statistics. The accurate clustering result is helpful for building the advertiser profiles so as to perform the forecasting.

translated by 谷歌翻译

Statistical Estimation of Confounded Linear MDPs: An Instrumental Variable Approach

Miao Lu , Wenhao Yang , Liangyu Zhang , Zhihua Zhang

分类： (统计)机器学习 | 机器学习

2022-09-12

在马尔可夫决策过程（MDP）中，可能存在不可观察的混杂因素并对数据生成过程产生影响，因此经典的非政策评估（OPE）估计器可能无法识别目标策略的真实价值函数。在本文中，我们研究了与可观察的仪器变量混杂的MDP中OPE的统计特性。具体而言，我们根据仪器变量提出了一个两阶段估计器，并在具有线性结构的混杂MDP中建立了其统计属性。对于非反应分析，我们证明了一个$ \ Mathcal {o}（n^{ - 1/2}）$ - 错误绑定了$ n $是样本的数量。对于渐近分析，我们证明了两阶段估计量在渐近正常上，典型速率为$ n^{1/2} $。据我们所知，我们是第一个通过仪器变量显示混合线性MDP的两阶段估计量的统计结果。

translated by 谷歌翻译

Towards Counterfactual Image Manipulation via CLIP

Yingchen Yu , Fangneng Zhan , Rongliang Wu , Jiahui Zhang , Shijian Lu , Miaomiao Cui , Xuansong Xie , Xian-Sheng Hua , Chunyan Miao

分类：计算机视觉

2022-07-06

利用Stylegan的表现力及其分离的潜在代码，现有方法可以实现对不同视觉属性的现实编辑，例如年龄和面部图像的性别。出现了一个有趣而又具有挑战性的问题：生成模型能否针对他们博学的先验进行反事实编辑？由于自然数据集中缺乏反事实样本，我们以文本驱动的方式研究了这个问题，并具有对比语言图像预言（剪辑），这些（剪辑）甚至可以为各种反事实概念提供丰富的语义知识。与内域操作不同，反事实操作需要更全面地剥削夹包含的语义知识，以及对编辑方向的更微妙的处理，以避免被卡在局部最低或不需要的编辑中。为此，我们设计了一种新颖的对比损失，该损失利用了预定义的夹子空间方向，从不同的角度将编辑指向所需的方向。此外，我们设计了一个简单而有效的方案，该方案将（目标文本）明确映射到潜在空间，并将其与潜在代码融合在一起，以进行有效的潜在代码优化和准确的编辑。广泛的实验表明，我们的设计在乘坐各种反事实概念的目标文本驾驶时，可以实现准确，现实的编辑。

translated by 谷歌翻译

Fine-grained Correlation Loss for Regression

Chaoyu Chen , Xin Yang , Ruobing Huang , Xindi Hu , Yankai Huang , Xiduo Lu , Xinrui Zhou , Mingyuan Luo , Yinyu Ye , Xue Shuang

分类：计算机视觉

2022-07-01

回归学习是经典的，是医学图像分析的基础。它为许多关键应用程序提供了连续的映射，例如属性估计，对象检测，分割和非刚性注册。但是，先前的研究主要以案例标准（如均方误差）为优化目标。他们忽略了非常重要的人口相关标准，这正是许多任务中的最终评估指标。在这项工作中，我们建议通过有关直接优化细粒相关损失的新型研究来重新审视经典回归任务。我们主要探索两个互补相关索引作为可学习的损失：Pearson线性相关（PLC）和Spearman等级相关性（SRC）。本文的贡献是两个折叠。首先，对于全球层面的PLC，我们提出了一项策略，以使其对异常值进行强大的态度并规范关键分布因素。这些努力显着稳定学习并扩大了PLC的功效。其次，对于本地级别的SRC，我们提出了一种粗到精细的方案，以减轻样品之间确切排名顺序的学习。具体而言，我们将样本排名的学习转换为样本之间相似关系的学习。我们在两个典型的超声图像回归任务上广泛验证了我们的方法，包括图像质量评估和生物措施测量。实验证明，通过直接优化相关性的细粒度指导，回归性能得到显着提高。我们提出的相关性损失是一般的，可以扩展到更重要的应用程序。

translated by 谷歌翻译

Lumbar Bone Mineral Density Estimation from Chest X-ray Images: Anatomy-aware Attentive Multi-ROI Modeling

Fakai Wang , Kang Zheng , Le Lu , Jing Xiao , Min Wu , Chang-Fu Kuo , Shun Miao

分类：计算机视觉

2022-01-05

骨质疏松症是一种常见的慢性代谢骨病，通常是由于对骨矿物密度（BMD）检查有限的有限获得而被诊断和妥善治疗，例如。通过双能X射线吸收测定法（DXA）。在本文中，我们提出了一种方法来预测来自胸X射线（CXR）的BMD，最常见的和低成本的医学成像考试之一。我们的方法首先自动检测来自CXR的局部和全球骨骼结构的感兴趣区域（ROI）。然后，开发了一种具有变压器编码器的多ROI深模型，以利用胸部X射线图像中的本地和全局信息以进行准确的BMD估计。我们的方法在13719 CXR患者病例中进行评估，并通过金标准DXA测量其实际BMD评分。该模型预测的BMD与地面真理（Pearson相关系数0.889腰腰1）具有强烈的相关性。当施用骨质疏松症筛查时，它实现了高分类性能（腰腰1的AUC 0.963）。作为现场使用CXR扫描预测BMD的第一次努力，所提出的算法在早期骨质疏松症筛查和公共卫生促进中具有很强的潜力。

translated by 谷歌翻译

Learning Robust Policy against Disturbance in Transition Dynamics via State-Conservative Policy Optimization

Yufei Kuang , Miao Lu , Jie Wang , Qi Zhou , Bin Li , Houqiang Li

分类：机器学习 | (统计)机器学习

2021-12-20

由于源极和目标环境之间的差异，深增强学习算法可以在现实世界的任务中表现不佳。这种差异通常被视为过渡动态的干扰。许多现有算法通过将干扰和应用于训练期间将其应用于源环境来学习强大的政策，这通常需要先验知识对模拟器的干扰和控制。然而，这些算法在目标环境中的干扰未知的情况下可能会失败，或者在模拟器中的模型中难以解决。为了解决这个问题，我们提出了一种新型的无模型演员 - 评论家算法 - 即状态保守政策优化（SCPO） - 学习强大的政策，而不会提前建立干扰。具体地，SCPO将转换动态的干扰降低到状态空间中的干扰，然后通过简单的基于梯度的常规器近似。 SCPO的吸引人的功能包括实施简单，不需要额外了解干扰或专门设计的模拟器。在若干机器人控制任务中的实验表明，SCPO了解抵抗过渡动态的干扰的强大政策。

translated by 谷歌翻译

Coherence Learning using Keypoint-based Pooling Network for Accurately Assessing Radiographic Knee Osteoarthritis

Kang Zheng , Yirui Wang , Chen-I Hsieh , Le Lu , Jing Xiao , Chang-Fu Kuo , Shun Miao

分类：计算机视觉

2021-12-16

膝关节骨关节炎（OA）是一种常见的堕落联合障碍，影响全世界的大型老年人。膝关节OA严重程度的准确放射线摄影评估在慢性患者管理中起着关键作用。目前临床采用的膝盖oA分级系统是观察者主观的，遭受帧间间的分歧。在这项工作中，我们提出了一种计算机辅助诊断方法，可以同时为两种复合材料和细粒度的OA等级提供更准确和一致的评估。提出了一种新的半监督学习方法，通过从未标记的数据学习来利用复合材料和细粒度的OA等级的潜在一致性。通过使用预先训练的高斯混合模型的日志概率表示等级相干性，我们制定了不连贯的损失，以纳入训练中的未标记数据。该方法还描述了基于关键点的汇集网络，其中从疾病目标键点（沿膝关节提取）汇集了深度图像特征，以提供更准确的和病于病理信息的特征表示，以获得准确的OA级评估。拟议的方法在公共骨关节炎倡议（OAI）数据上全面评估了4,796名科目的多中心的十年观测研究。实验结果表明，我们的方法对以前的强大的整个图像的深度分类网络基线（如Resnet-50）的显着改进。

translated by 谷歌翻译

Few-Shot NLU with Vector Projection Distance and Abstract Triangular CRF

Su Zhu , Lu Chen , Ruisheng Cao , Zhi Chen , Qingliang Miao , Kai Yu

分类：自然语言处理

2021-12-09

数据稀疏问题是自然语言理解（NLU）的关键挑战，特别是对于新的目标域。通过在源域中训练NLU模型并直接将模型应用于任意目标域（即使没有微调），很少拍摄的NLU对缓解数据稀缺问题至关重要。在本文中，我们建议改进具有矢量投影距离和抽象三角条件随机场（CRF）的原型网络，用于几次射击NLU。向量投影距离利用在标签向量上的上下文词嵌入的投影作为单词标签相似度，其等同于归一化的线性模型。抽象三角CRF了解用于联合意图分类和插槽填充任务的域名忽视标签转换。广泛的实验表明，我们所提出的方法可以显着超越强力基线。具体而言，我们的方法可以在中文和英语中达到两次拍摄的两次拍摄NLU基准（几个关节和剪辑）的新技术，而无需对目标域的微调。

translated by 谷歌翻译

MFNet: Multi-filter Directive Network for Weakly Supervised Salient Object Detection

Yongri Piao , Jian Wang , Miao Zhang , Huchuan Lu

分类：计算机视觉

2021-12-03

弱监督的突出物体检测（WSOD）仅使用低成本注释训练基于CNNS的显着性网络的目标。现有的WSOD方法采用各种技术来从低成本注释追求单一的“高质量”伪标签，然后开发其显着网络。虽然这些方法实现了良好的性能，但是所产生的单个标签不可避免地受到采用的细化算法的影响，并且显示了偏见的特征，这进一步影响了显着网络。在这项工作中，我们介绍了一个新的多伪标签框架，以从多个标签集成更全面和准确的显着性提示，避免上述问题。具体地，我们提出了一种多滤波器指令网络（MFNET），包括显着网络以及多个指令滤波器。指令过滤器（DF）旨在从嘈杂的伪标签中提取和过滤更准确的显着性提示。然后，来自多个DF的多个精确的线索随着多引导损耗同时传播到显着网络。在四个度量标准的五个数据集上进行了广泛的实验表明我们的方法优于所有现有的基础方法。此外，还值得注意的是，我们的框架足够灵活，适用于现有方法并提高其性能。

translated by 谷歌翻译

Bi-level Feature Alignment for Versatile Image Translation and Manipulation

Fangneng Zhan , Yingchen Yu , Rongliang Wu , Jiahui Zhang , Kaiwen Cui , Aoran Xiao , Shijian Lu , Chunyan Miao

分类：计算机视觉

2021-07-07

生成的对抗网络（GAN）在图像翻译和操纵方面取得了巨大成功。但是，具有忠实风格控制的高保真形象生成仍然是计算机视觉中的巨大挑战。本文提出了一种多功能的图像翻译和操纵框架，该框架通过明确构建信件来实现图像生成中准确的语义和样式指导。为了处理通过构建密集的对应关系产生的二次复杂性，我们引入了双层功能对齐策略，该策略采用顶部$ k $操作来对块构成块的功能进行排名，然后在块功能之间进行密集的关注，从而降低了内存成本的降低。由于顶部$ k $操作涉及索引交换，从而排除了梯度传播，因此我们近似具有正则地球搬运工问题的非差异上的顶部$ K $操作，以便可以有效地向后传播其梯度。此外，我们设计了一个新颖的语义位置编码机制，该机制为每个单个语义区域建立坐标，以在建立对应关系时保持纹理结构。此外，我们设计了一种新颖的置信度注入模块，该模块通过根据内置对应关系的可靠性适应特征来减轻不匹配问题。广泛的实验表明，与最先进的方法相比，我们的方法在定性和定量上取得了出色的性能。

translated by 谷歌翻译