智能论文笔记

DiP: Learning Discriminative Implicit Parts for Person Re-Identification

Dengjie Li , Siyu Chen , Yujie Zhong , Fan Liang , Lin Ma

分类：计算机视觉

2022-12-24

In person re-identification (ReID) tasks, many works explore the learning of part features to improve the performance over global image features. Existing methods extract part features in an explicit manner, by either using a hand-designed image division or keypoints obtained with external visual systems. In this work, we propose to learn Discriminative implicit Parts (DiPs) which are decoupled from explicit body parts. Therefore, DiPs can learn to extract any discriminative features that can benefit in distinguishing identities, which is beyond predefined body parts (such as accessories). Moreover, we propose a novel implicit position to give a geometric interpretation for each DiP. The implicit position can also serve as a learning signal to encourage DiPs to be more position-equivariant with the identity in the image. Lastly, a set of attributes and auxiliary losses are introduced to further improve the learning of DiPs. Extensive experiments show that the proposed method achieves state-of-the-art performance on multiple person ReID benchmarks.

translated by 谷歌翻译

Unsupervised Domain Adaptation for Automated Knee Osteoarthritis Phenotype Classification

Junru Zhong , Yongcheng Yao , Donal G. Cahill , Fan Xiao , Siyue Li , Jack Lee , Kevin Ki-Wai Ho , Michael Tim-Yun Ong , James F. Griffith , Weitian Chen

分类：计算机视觉

2022-12-14

Purpose: The aim of this study was to demonstrate the utility of unsupervised domain adaptation (UDA) in automated knee osteoarthritis (OA) phenotype classification using a small dataset (n=50). Materials and Methods: For this retrospective study, we collected 3,166 three-dimensional (3D) double-echo steady-state magnetic resonance (MR) images from the Osteoarthritis Initiative dataset and 50 3D turbo/fast spin-echo MR images from our institute (in 2020 and 2021) as the source and target datasets, respectively. For each patient, the degree of knee OA was initially graded according to the MRI Osteoarthritis Knee Score (MOAKS) before being converted to binary OA phenotype labels. The proposed UDA pipeline included (a) pre-processing, which involved automatic segmentation and region-of-interest cropping; (b) source classifier training, which involved pre-training phenotype classifiers on the source dataset; (c) target encoder adaptation, which involved unsupervised adaption of the source encoder to the target encoder and (d) target classifier validation, which involved statistical analysis of the target classification performance evaluated by the area under the receiver operating characteristic curve (AUROC), sensitivity, specificity and accuracy. Additionally, a classifier was trained without UDA for comparison. Results: The target classifier trained with UDA achieved improved AUROC, sensitivity, specificity and accuracy for both knee OA phenotypes compared with the classifier trained without UDA. Conclusion: The proposed UDA approach improves the performance of automated knee OA phenotype classification for small target datasets by utilising a large, high-quality source dataset for training. The results successfully demonstrated the advantages of the UDA approach in classification on small datasets.

translated by 谷歌翻译

Deep Generative Modeling on Limited Data with Regularization by Nontransferable Pre-trained Models

Yong Zhong , Hongtao Liu , Xiaodong Liu , Fan Bao , Weiran Shen , Chongxuan Li

分类：机器学习 | 计算机视觉

2022-08-30

深生成模型（DGM）是数据浏览的。从本质上讲，这是因为在有限数据上学习一个复杂的模型，遭受了较大的差异和容易过度的折磨。受\ emph {偏见 - 变化困境}的启发，我们提出了\ emph {正则化的深生成模型}（reg-dgm），该模型}（reg-dgm）利用了不可转移的预训练模型来减少具有有限数据的生成模型的变异。正式地，Reg-DGM优化了数据分布与DGM之间一定差异的加权总和，以及预先训练的模型W.R.T.定义的能量函数的期望。 DGM。从理论上讲，我们表征了Reg-DGM在非参数环境中全球最小值的存在和独特性，并严格证明Reg-DGM W.R.T.的统计益处。在一个简单而代表性的高斯拟合示例中，平均误差和预期风险。从经验上讲，在Reg-DGM中指定DGM和预训练的模型是非常灵活的。尤其是，使用RESNET-18分类器在ImageNet上进行了预先培训和数据依赖性能量功能，Reg-DGM始终在几个基准上改善了强大的DGM的生成性能，包括StyleGAN2和ADA在几个基准上，具有有限的数据，并为国家取得了竞争性的结果 - 艺术方法。

translated by 谷歌翻译

HTML版本

Towards Real-World Video Deblurring by Exploring Blur Formation Process

Mingdeng Cao , Zhihang Zhong , Yanbo Fan , Jiahao Wang , Yong Zhang , Jue Wang , Yujiu Yang , Yinqiang Zheng

分类：计算机视觉

2022-08-28

本文旨在探讨如何合成对其进行训练的现有视频脱毛模型的近距离模糊，可以很好地推广到现实世界中的模糊视频。近年来，基于深度学习的方法已在视频Deblurring任务上取得了希望的成功。但是，对现有合成数据集培训的模型仍然遭受了与现实世界中的模糊场景的概括问题。造成故障的因素仍然未知。因此，我们重新审视经典的模糊综合管道，并找出可能的原因，包括拍摄参数，模糊形成空间和图像信号处理器〜（ISP）。为了分析这些潜在因素的效果，我们首先收集一个超高帧速率（940 fps）原始视频数据集作为数据基础，以综合各种模糊。然后，我们提出了一种新颖的现实模糊合成管道，该管道通过利用模糊形成线索称为原始爆炸。通过大量实验，我们证明了在原始空间中的合成模糊并采用与现实世界测试数据相同的ISP可以有效消除合成数据的负面影响。此外，合成的模糊视频的拍摄参数，例如，曝光时间和框架速率在改善脱毛模型的性能中起着重要作用。令人印象深刻的是，与在现有合成模糊数据集中训练的训练的模型合成的模糊数据训练的模型可以获得超过5DB PSNR的增益。我们认为，新颖的现实合成管道和相应的原始视频数据集可以帮助社区轻松构建自定义的Blur数据集，以改善现实世界的视频DeBlurring性能，而不是费力地收集真实的数据对。

translated by 谷歌翻译

Battery and Hydrogen Energy Storage Control in a Smart Energy Network with Flexible Energy Demand using Deep Reinforcement Learning

Cephas Samende , Zhong Fan , Jun Cao

分类：人工智能 | 机器学习

2022-08-26

智能能源网络提供了一种有效的手段，可容纳可变可再生能源（例如太阳能和风能）的高渗透率，这是能源生产深度脱碳的关键。但是，鉴于可再生能源以及能源需求的可变性，必须制定有效的控制和能源存储方案来管理可变的能源产生并实现所需的系统经济学和环境目标。在本文中，我们引入了由电池和氢能存储组成的混合储能系统，以处理与电价，可再生能源生产和消费有关的不确定性。我们旨在提高可再生能源利用率，并最大程度地减少能源成本和碳排放，同时确保网络内的能源可靠性和稳定性。为了实现这一目标，我们提出了一种多代理的深层确定性政策梯度方法，这是一种基于强化的基于强化学习的控制策略，可实时优化混合能源存储系统和能源需求的调度。提出的方法是无模型的，不需要明确的知识和智能能源网络环境的严格数学模型。基于现实世界数据的仿真结果表明：（i）混合储能系统和能源需求的集成和优化操作可将碳排放量减少78.69％，将成本节省的成本储蓄提高23.5％，可续订的能源利用率比13.2％以上。其他基线模型和（ii）所提出的算法优于最先进的自学习算法，例如Deep-Q网络。

translated by 谷歌翻译

HTML版本

Large-displacement 3D Object Tracking with Hybrid Non-local Optimization

Xuhui Tian , Xinran Lin , Fan Zhong , Xueying Qin

分类：计算机视觉

2022-07-26

已知基于优化的3D对象跟踪是精确且快速的，但对大型框架间位移敏感。在本文中，我们提出了一种快速有效的非本地3D跟踪方法。基于观察到错误的局部最小值主要是由于平面外旋转引起的，我们提出了一种混合方法，该方法将非本地和局部优化的不同参数结合在一起，从而在6D姿势空间中有效地进行非本地搜索。此外，为姿势优化提出了一种预先计算的基于强大轮廓的跟踪方法。通过使用带有多个候选对应的长搜索线，它可以适应不同的帧位移而无需粗到精细的搜索。在预计算之前，可以非常快速地进行姿势更新，从而使非本地优化实时运行。我们的方法优于大小位移的所有先前方法。对于大型位移，精度得到了极大的提高（$ 81.7 \％\; \ text {v.s。} \; 19.4 \％$）。同时，只有CPU可以实现实时速度（$> $ 50fps）。源代码可在\ url {https://github.com/cvbubbles/nonlocal-3dtracking}中获得。

translated by 谷歌翻译

Renewable energy integration and microgrid energy trading using multi-agent deep reinforcement learning

Daniel J. B. Harrold , Jun Cao , Zhong Fan

分类：人工智能 | 机器学习

2021-11-21

在本文中，多种子体增强学习用于控制混合能量存储系统，通过最大化可再生能源和交易的价值来降低微电网的能量成本。该代理商必须学习在波动需求，动态批发能源价格和不可预测的可再生能源中，控制三种不同类型的能量存储系统。考虑了两种案例研究：首先看能量存储系统如何在动态定价下更好地整合可再生能源发电，第二种与这些同一代理商如何与聚合剂一起使用，以向自私外部微电网销售能量的能量减少自己的能源票据。这项工作发现，具有分散执行的多代理深度确定性政策梯度的集中学习及其最先进的变体允许多种代理方法显着地比来自单个全局代理的控制更好。还发现，在多种子体方法中使用单独的奖励功能比使用单个控制剂更好。还发现能够与其他微电网交易，而不是卖回实用电网，也发现大大增加了网格的储蓄。

translated by 谷歌翻译

RGB-D Saliency Detection via Cascaded Mutual Information Minimization

Jing Zhang , Deng-Ping Fan , Yuchao Dai , Xin Yu , Yiran Zhong , Nick Barnes , Ling Shao

分类：计算机视觉

2021-09-15

现有的RGB-D显着性检测模型没有明确鼓励RGB和深度来实现有效的多模态学习。在本文中，我们通过互信息最小化介绍了一种新的多级级联学习框架，以“明确”模拟RGB图像和深度数据之间的多模态信息。具体地，我们首先将每个模式的特征映射到较低的维度特征向量，并采用互信息最小化作为常规器，以减少来自RGB的外观特征与来自深度的几何特征之间的冗余。然后，我们执行多级级联学习，在网络的每个阶段强加相互信息最小化约束。基准RGB-D显着数据集的广泛实验说明了我们框架的有效性。此外，为了繁荣发展该领域，我们贡献了最大（比NJU2K大7倍）数据集，其中包含具有高质量多边形/杂文/对象/ instance- / rank级注释的15,625图像对。基于这些丰富的标签，我们另外构建了具有强大基线的四个新基准，并观察了一些有趣的现象，可以激励未来的模型设计。源代码和数据集可在“https://github.com/jingzhang617/cascaded_rgbd_sod”中获得。

translated by 谷歌翻译

Federated Learning for Short-term Residential Load Forecasting

Christopher Briggs , Zhong Fan , Peter Andras

分类：机器学习

2021-05-27

负载预测是能源行业中执行的一项重要任务，以帮助平衡供应并保持电网的稳定负载。随着供应过渡向不太可靠的可再生能源产生，智能电表将证明是促进这些预测任务的重要组成部分。但是，在隐私意识的消费者中，智能电表的采用率很低，这些消费者害怕侵犯其细粒度的消费数据。在这项工作中，我们建议并探索一种基于联合学习的方法（FL）方法，以分布式协作方式培训预测模型，同时保留基础数据的隐私。我们比较了两种方法：FL和聚集的变体FL+HC与非私有的，集中的学习方法和完全私人的本地化学习方法。在这些方法中，我们使用RMSE和计算效率测量模型性能。此外，我们建议FL策略之后是个性化步骤，并表明可以通过这样做可以提高模型性能。我们表明，FL+HC紧随其后的是个性化可以实现$ \ sim $ 5 \％的模型性能提高，而与本地化学习相比，计算$ \ sim $ 10倍。最后，我们提供有关私人汇总预测的建议，以构建私人端到端负载预测应用程序。

translated by 谷歌翻译

Fed-EINI: An Efficient and Interpretable Inference Framework for Decision Tree Ensembles in Federated Learning

Xiaolin Chen , Shuai Zhou , Bei guan , Kai Yang , Hao Fan , Zejin Feng , Zhong Chen , Hu Wang , Yongji Wang

分类：机器学习 | 人工智能

2021-05-20

关于数据隐私和安全性的越来越多的担忧驱动了从孤立的数据源，即联合学习的隐私保留机学习的新兴领域。一类联合学习，\ Texit {垂直联合学习}，不同的各方对共同用户的不同特征，具有促进许多领域企业之间各种业务合作的潜力。在机器学习中，诸如梯度提升决策树（GBDT）和随机森林等决策树集合被广泛应用强大的型号，具有高的可解释性和建模效率。然而，最先进的垂直联合学习框架适应匿名功能以避免可能的数据泄露，使模型受到损害的可解释性。为了解决推理过程中的这个问题，在本文中，我们首先在垂直联合学习中对客场党的特征披露含义的必要性进行了问题分析。然后，我们发现树的预测结果可以表示为所有各方持有的树的子模型结果的交叉点。利用这种关键观察，我们通过隐藏决策路径来保护数据隐私并允许公开特征含义，并适应推理输出的通信有效的安全计算方法。通过理论分析和广泛的数值结果，将证明FED-EINI的优点。我们通过披露特征的含义来提高模型的可解释性，同时确保效率和准确性。

translated by 谷歌翻译