智能论文笔记

Target Detection Framework for Lobster Eye X-Ray Telescopes with Machine Learning Algorithms

Peng Jia , Wenbo Liu , Yuan Liu , Haiwu Pan

分类：计算机视觉

2022-12-11

Lobster eye telescopes are ideal monitors to detect X-ray transients, because they could observe celestial objects over a wide field of view in X-ray band. However, images obtained by lobster eye telescopes are modified by their unique point spread functions, making it hard to design a high efficiency target detection algorithm. In this paper, we integrate several machine learning algorithms to build a target detection framework for data obtained by lobster eye telescopes. Our framework would firstly generate two 2D images with different pixel scales according to positions of photons on the detector. Then an algorithm based on morphological operations and two neural networks would be used to detect candidates of celestial objects with different flux from these 2D images. At last, a random forest algorithm will be used to pick up final detection results from candidates obtained by previous steps. Tested with simulated data of the Wide-field X-ray Telescope onboard the Einstein Probe, our detection framework could achieve over 94% purity and over 90% completeness for targets with flux more than 3 mCrab (9.6 * 10-11 erg/cm2/s) and more than 94% purity and moderate completeness for targets with lower flux at acceptable time cost. The framework proposed in this paper could be used as references for data processing methods developed for other lobster eye X-ray telescopes.

translated by 谷歌翻译

Detection of Strongly Lensed Arcs in Galaxy Clusters with Transformers

Peng Jia , Ruiqi Sun , Nan Li , Yu Song , Runyu Ning , Hongyan Wei , Rui Luo

分类：计算机视觉

2022-11-11

Strong lensing in galaxy clusters probes properties of dense cores of dark matter halos in mass, studies the distant universe at flux levels and spatial resolutions otherwise unavailable, and constrains cosmological models independently. The next-generation large scale sky imaging surveys are expected to discover thousands of cluster-scale strong lenses, which would lead to unprecedented opportunities for applying cluster-scale strong lenses to solve astrophysical and cosmological problems. However, the large dataset challenges astronomers to identify and extract strong lensing signals, particularly strongly lensed arcs, because of their complexity and variety. Hence, we propose a framework to detect cluster-scale strongly lensed arcs, which contains a transformer-based detection algorithm and an image simulation algorithm. We embed prior information of strongly lensed arcs at cluster-scale into the training data through simulation and then train the detection algorithm with simulated images. We use the trained transformer to detect strongly lensed arcs from simulated and real data. Results show that our approach could achieve 99.63 % accuracy rate, 90.32 % recall rate, 85.37 % precision rate and 0.23 % false positive rate in detection of strongly lensed arcs from simulated images and could detect almost all strongly lensed arcs in real observation images. Besides, with an interpretation method, we have shown that our method could identify important information embedded in simulated data. Next step, to test the reliability and usability of our approach, we will apply it to available observations (e.g., DESI Legacy Imaging Surveys) and simulated data of upcoming large-scale sky surveys, such as the Euclid and the CSST.

translated by 谷歌翻译

Robust Domain Adaptation for Machine Reading Comprehension

Liang Jiang , Zhenyu Huang , Jia Liu , Zujie Wen , Xi Peng

分类：机器学习 | 自然语言处理

2022-09-23

用于机器阅读理解（MRC）的大多数领域适应方法都使用预先训练的问题解答（QA）构造模型来生成用于MRC传输的伪QA对。这样的过程将不可避免地引入不匹配的对（即嘈杂的对应关系），因此由于i）目标文档中不可用的QA对，ii）在将QA构造模型应用于目标域时的域移位。毫无疑问，嘈杂的信件将退化MRC的性能，但是现有作品忽略了MRC的性能。为了解决这样一个未触及的问题，我们建议通过使用与文档相关的对话以及MRC的新域适应方法来构建质量检查对。具体而言，我们建议用于机器阅读理解理解（RMRC）方法的强大域适应性，该方法由答案提取器（AE），问题选择器（QS）和MRC模型组成。具体而言，RMRC通过通过AE估算与文档的相关性来滤除无关的答案，并通过通过QS将候选问题融合在多轮对话聊天中来提取问题。使用提取的QA对，MRC进行了微调，并提供了反馈，以通过一种新颖的增强自我训练方法优化QS。得益于QS的优化，我们的方法将大大减轻域转移引起的嘈杂对应问题。据我们所知，这可能是揭示噪声对应性在域适应MRC模型中的影响的第一个研究，并显示出一种可行的方法来实现与错配对的鲁棒性。在三个数据集上进行的广泛实验证明了我们方法的有效性。

translated by 谷歌翻译

Cross-Network Social User Embedding with Hybrid Differential Privacy Guarantees

Jiaqian Ren , Lei Jiang , Hao Peng , Lingjuan Lyu , Zhiwei Liu , Chaochao Chen , Jia Wu , Xu Bai , Philip S. Yu

分类：人工智能

2022-09-04

整合多个在线社交网络（OSN）对许多下游社交挖掘任务（例如用户偏好建模，建议和链接预测）具有重要意义。但是，不幸的是，伴随着越来越多的隐私问题，泄漏敏感用户信息。如何完全利用来自不同在线社交网络的数据，同时保存用户隐私仍然无法解决。为此，我们提出了一个跨网络的社交用户嵌入框架，即DP-Crosue，以一种隐私性的方式学习用户的全面表示。我们共同考虑具有不同隐私保证的部分调整社交网络的信息。特别是，对于每个异质社交网络，我们首先引入一个混合差异隐私概念，以捕获异构数据类型的隐私期望的变化。接下来，为了找到跨社交网络的用户链接，我们进行了无监督的基于用户嵌入的对齐方式，其中通过异质网络嵌入技术实现了用户嵌入。为了进一步增强用户嵌入，一种新颖的跨网络GCN嵌入模型旨在通过那些对齐用户跨网络传输知识。在三个现实世界数据集上进行的广泛实验表明，我们的方法对用户兴趣预测任务以及捍卫用户属性推理攻击的嵌入进行了重大改进。

translated by 谷歌翻译

Clustering Egocentric Images in Passive Dietary Monitoring with Self-Supervised Learning

Jiachuan Peng , Peilun Shi , Jianing Qiu , Xinwei Ju , Frank P. -W. Lo , Xiao Gu , Wenyan Jia , Tom Baranowski , Matilda Steiner-Asiedu , Alex K. Anderson

分类：计算机视觉

2022-08-25

在我们最近在加纳被动饮食监测的饮食评估现场研究中，我们收集了超过25万件野外图像。该数据集是一种持续的努力，旨在通过被动监控摄像头技术在低收入和中等收入国家中准确测量单个食物和营养摄入量。目前的数据集涉及加纳农村地区和城市地区的20个家庭（74个受试者），研究中使用了两种不同类型的可穿戴摄像机。一旦开始，可穿戴摄像机会不断捕获受试者的活动，该活动会产生大量的数据，以便在进行分析之前清洁和注释。为了简化数据后处理和注释任务，我们提出了一个新颖的自学学习框架，以将大量以自我为中心的图像聚集到单独的事件中。每个事件都由一系列时间连续和上下文相似的图像组成。通过将图像聚集到单独的事件中，注释者和营养师可以更有效地检查和分析数据，并促进随后的饮食评估过程。在带有地面真实标签的固定测试套装上验证，拟议的框架在聚集质量和分类准确性方面优于基准。

translated by 谷歌翻译

AIM 2022 Challenge on Super-Resolution of Compressed Image and Video: Dataset, Methods and Results

Ren Yang , Radu Timofte , Xin Li , Qi Zhang , Lin Zhang , Fanglong Liu , Dongliang He , Fu li , He Zheng , Weihang Yuan

分类：计算机视觉

2022-08-23

本文回顾了AIM 2022上压缩图像和视频超级分辨率的挑战。这项挑战包括两条曲目。轨道1的目标是压缩图像的超分辨率，轨迹〜2靶向压缩视频的超分辨率。在轨道1中，我们使用流行的数据集DIV2K作为培训，验证和测试集。在轨道2中，我们提出了LDV 3.0数据集，其中包含365个视频，包括LDV 2.0数据集（335个视频）和30个其他视频。在这一挑战中，有12支球队和2支球队分别提交了赛道1和赛道2的最终结果。所提出的方法和解决方案衡量了压缩图像和视频上超分辨率的最先进。提出的LDV 3.0数据集可在https://github.com/renyang-home/ldv_dataset上找到。此挑战的首页是在https://github.com/renyang-home/aim22_compresssr。

translated by 谷歌翻译

Automating DBSCAN via Deep Reinforcement Learning

Ruitong Zhang , Hao Peng , Yingtong Dou , Jia Wu , Qingyun Sun , Jingyi Zhang , Philip S. Yu

分类：机器学习

2022-08-09

DBSCAN由于其简单性和实用性而被广泛用于许多科学和工程领域。但是，由于其高灵敏度参数，聚类结果的准确性在很大程度上取决于实践经验。在本文中，我们首先提出了一种新颖的深钢筋学习指导自动DBSCAN参数搜索框架，即DRL-DBSCAN。该框架通过将聚类环境视为马尔可夫决策过程来模拟调整参数搜索方向的过程，该过程旨在在没有手动帮助的情况下找到最佳的聚类参数。 DRL-DBSCAN使用弱监督的奖励培训策略网络，通过与群集进行交互来了解不同特征分布的最佳聚类参数搜索策略。此外，我们还提出了一个由数据规模驱动的递归搜索机制，以有效且可控制地处理大参数空间。基于拟议的四种工作模式，在五个人工和现实世界数据集上进行了广泛的实验。离线和在线任务的结果表明，DRL-DBSCCUN不仅始终如一地提高DBSCAN聚类精度高达26％和25％，而且可以稳定地找到具有较高计算效率的主要参数。该代码可在https://github.com/ringbdstack/drl-dbscan上找到。

translated by 谷歌翻译

Hybrid Multimodal Feature Extraction, Mining and Fusion for Sentiment Analysis

Jia Li , Ziyang Zhang , Junjie Lang , Yueqi Jiang , Liuwei An , Peng Zou , Yangyang Xu , Sheng Gao , Jie Lin , Chunxiao Fan

分类：计算机视觉 | 自然语言处理

2022-08-05

在本文中，我们介绍了2022年多模式情感分析挑战（MUSE）的解决方案，其中包括Muse-Humor，Muse-Rection和Muse Surns Sub-Challenges。 2022年穆斯穆斯（Muse 2022）着重于幽默检测，情绪反应和多模式的情感压力，利用不同的方式和数据集。在我们的工作中，提取了不同种类的多模式特征，包括声学，视觉，文本和生物学特征。这些功能由Temma和Gru融合到自发机制框架中。在本文中，1）提取了一些新的音频功能，面部表达功能和段落级文本嵌入以进行准确的改进。 2）我们通过挖掘和融合多模式特征来显着提高多模式情感预测的准确性和可靠性。 3）在模型培训中应用有效的数据增强策略，以减轻样本不平衡问题并防止模型形成学习有偏见的主题字符。对于博物馆的子挑战，我们的模型获得了0.8932的AUC分数。对于Muse Rection子挑战，我们在测试集上的Pearson相关系数为0.3879，它的表现优于所有其他参与者。对于Muse Surst Sub-Challenge，我们的方法在测试数据集上的唤醒和价值都优于基线，达到了0.5151的最终综合结果。

translated by 谷歌翻译

Towards Efficient and Scale-Robust Ultra-High-Definition Image Demoireing

Xin Yu , Peng Dai , Wenbo Li , Lan Ma , Jiajun Shen , Jia Li , Xiaojuan Qi

分类：计算机视觉

2022-07-20

随着移动设备的快速开发，现代使用的手机通常允许用户捕获4K分辨率（即超高定义）图像。然而，对于图像进行示范，在低级视觉中，一项艰巨的任务，现有作品通常是在低分辨率或合成图像上进行的。因此，这些方法对4K分辨率图像的有效性仍然未知。在本文中，我们探索了Moire模式的删除，以进行超高定义图像。为此，我们提出了第一个超高定义的演示数据集（UHDM），其中包含5,000个现实世界4K分辨率图像对，并对当前最新方法进行基准研究。此外，我们提出了一个有效的基线模型ESDNET来解决4K Moire图像，其中我们构建了一个语义对准的比例感知模块来解决Moire模式的尺度变化。广泛的实验表明了我们的方法的有效性，这可以超过最轻巧的优于最先进的方法。代码和数据集可在https://xinyu-andy.github.io/uhdm-page上找到。

translated by 谷歌翻译

SiaTrans: Siamese Transformer Network for RGB-D Salient Object Detection with Depth Image Classification

Xingzhao Jia , Dongye Changlei , Yanjun Peng

分类：计算机视觉 | 机器学习

2022-07-09

RGB-D SOD使用深度信息来处理具有挑战性的场景并获得高质量的显着图。现有的最新RGB-D显着检测方法压倒性地取决于直接融合深度信息的策略。尽管这些方法通过各种跨模式融合策略提高了显着性预测的准确性，但通过某些质量质量较差的图像提供的错误信息可能会影响显着性预测结果。为了解决这个问题，本文提出了一种新颖的RGB-D显着对象检测模型（SIATRANS），该模型允许与SOD培训同时对深度图像质量分类进行训练。鉴于RGB和深度图像之间的常见信息，SIATRANS使用具有共享权重参数的暹罗变压器网络作为编码器，并提取RGB和深度特征在批处理尺寸上加入，从而在不损害性能的情况下节省空间资源。 SIATRANS在骨干网络（T2T-VIT）中使用类令牌来对深度图像的质量进行分类，而无需阻止令牌序列执行显着检测任务。基于变压器的跨模式融合模块（CMF）可以有效地融合RGB和深度信息。在测试过程中，CMF可以根据深度图像的质量分类信号选择融合交叉模式信息或增强RGB信息。我们设计的CMF和解码器的最大好处是，它们保持RGB和RGB-D信息解码的一致性：SIATRANS根据测试过程中的分类信号在相同的模型参数下解码RGB-D或RGB信息。在9个RGB-D SOD基准数据集上进行的全面实验表明，与最近最新方法相比，SIATRANS的总体性能和最少的计算最低。

translated by 谷歌翻译