智能论文笔记

Learned Distributed Image Compression with Multi-Scale Patch Matching in Feature Domai

Yujun Huang , Bin Chen , Shiyu Qin , Jiawei Li , Yaowei Wang , Tao Dai , Shu-Tao Xia

分类：计算机视觉

2022-09-06

除了在经典图像压缩编解码器上实现较高的压缩效率外，还可以通过其他侧面信息（例如，从同一场景的不同角度）改进深层图像压缩。为了更好地利用分布式压缩方案下的侧面信息，现有方法（Ayzik和Avidan 2020）仅在图像域上实现匹配的补丁，以解决由查看点差异引起的视差问题。但是，在图像域上匹配的补丁匹配对由不同的视角引起的比例，形状和照明的差异并不强大，也无法充分利用侧面信息图像的丰富纹理信息。为了解决此问题，我们建议在分布式图像压缩模型的解码器上充分利用多尺度特征域贴片匹配（MSFDPM）。具体而言，MSFDPM由侧面信息特征提取器，多尺度特征域补丁匹配模块和多尺度特征融合网络组成。此外，我们重复使用从浅层层进行斑点相关性，以加速深层的贴片匹配。最后，我们认为，与图像域（Ayzik和Avidan 2020）的贴片匹配方法相比，在多尺度特征域中的匹配进一步提高了压缩率约20％。

translated by 谷歌翻译

Compiler-Aware Neural Architecture Search for On-Mobile Real-time Super-Resolution

Yushu Wu , Yifan Gong , Pu Zhao , Yanyu Li , Zheng Zhan , Wei Niu , Hao Tang , Minghai Qin , Bin Ren , Yanzhi Wang

分类：计算机视觉 | 机器学习

2022-07-25

基于深度学习的超分辨率（SR）近年来由于其高图像质量性能和广泛的应用方案而获得了极大的知名度。但是，先前的方法通常会遭受大量计算和巨大的功耗，这会导致实时推断的困难，尤其是在资源有限的平台（例如移动设备）上。为了减轻这种情况，我们建议使用自适应SR块进行深度搜索和每层宽度搜索，以进行深度搜索和每层宽度搜索。推理速度与SR损失一起直接将其带入具有高图像质量的SR模型，同时满足实时推理需求。借用了与编译器优化的速度模型在搜索过程中每次迭代中的移动设备上的速度，以预测具有各种宽度配置的SR块的推理潜伏期，以更快地收敛。通过提出的框架，我们在移动平台的GPU/DSP上实现了实时SR推断，以实现具有竞争性SR性能的720p分辨率（三星Galaxy S21）。

translated by 谷歌翻译

Optimization of Forcemyography Sensor Placement for Arm Movement Recognition

Xiaohao Xu , Zihao Du , Huaxin Zhang , Ruichao Zhang , Zihan Hong , Qin Huang , Bin Han

分类：计算机视觉 | 机器人

2022-07-22

如何设计用于人类运动识别的最佳可穿戴设备对于可靠，准确的人机合作至关重要。先前的作品主要是通过启发性制造可穿戴设备。取而代之的是，本文提出了一个学术问题：我们可以设计一种优化算法来优化可穿戴设备的制造，例如自动弄清最佳传感器布置吗？具体而言，这项工作着重于优化用于FMG臂章的示型传感器（FMG）传感器的放置，以应用手臂运动识别。首先，基于图理论，考虑传感器的信号和连接性，对臂章进行了建模。然后，引入了基于图形的臂章建模网络（GAM-NET），以供手臂运动识别。之后，制定了FMG臂章的传感器放置优化，并提出了具有贪婪的本地搜索的优化算法。为了研究我们的优化算法的有效性，收集了使用带有16个传感器的FMG臂章的机械维护任务的数据集。我们的实验表明，仅使用使用我们的算法优化的4个传感器可以帮助保持与使用所有传感器的可比识别精度。最后，从生理视图验证了优化的传感器放置结果。这项工作希望阐明考虑下游任务（例如人类生物信号收集和运动识别）的可穿戴设备的自动制造。我们的代码和数据集可从https://github.com/jerryx1110/iros22-fmg-sensor-optimization获得

translated by 谷歌翻译

VEM$^2$L: A Plug-and-play Framework for Fusing Text and Structure Knowledge on Sparse Knowledge Graph Completion

Tao He , Tianwen Jiang , Zihao Zheng , Haichao Zhu , Jingrun Zhang , Ming Liu , Sendong Zhao , Bin Qin

分类：自然语言处理

2022-07-04

知识图完成最近已广泛研究，以通过主要建模图结构特征来完成三元组中的缺失元素，但对图形结构的稀疏性敏感。期望解决这一挑战的相关文本，例如实体名称和描述，充当知识图（kgs）的另一种表达形式（kgs）。已经提出了几种使用两个编码器的结构和文本消息的方法，但由于未能平衡它们之间的权重有限。并在推理期间保留结构和文本编码器，也遭受了沉重的参数。通过知识蒸馏的激励，我们将知识视为从输入到输出概率的映射，并在稀疏的kgs上提出了一个插件框架VEM2L，以将从文本和结构消息提取到统一的知识中融合知识。具体而言，我们将模型获取的知识分配为两个不重叠的部分：一个部分与训练三元组合的合适能力有关，可以通过激励两个编码者互相学习训练集来融合。另一个反映了未观察到的查询的概括能力。相应地，我们提出了一种新的融合策略，该策略由变量EM算法证明，以融合模型的概括能力，在此期间，我们还应用图形致密操作以进一步缓解稀疏的图形问题。通过结合这两种融合方法，我们最终提出了VEM2L框架。详细的理论证据以及定量和定性实验都证明了我们提出的框架的有效性和效率。

translated by 谷歌翻译

RetroGraph: Retrosynthetic Planning with Graph Search

Shufang Xie , Rui Yan , Peng Han , Yingce Xia , Lijun Wu , Chenjuan Guo , Bin Yang , Tao Qin

分类：人工智能 | 机器学习

2022-06-23

旨在找到合成靶分子的反应途径的循环合成计划在化学和药物发现中起着重要作用。此任务通常被建模为搜索问题。最近，数据驱动的方法吸引了许多研究兴趣，并显示了反递归计划的有希望的结果。我们观察到在搜索过程中多次访问了相同的中间分子，并且通常在先前基于树的方法（例如，或树搜索，蒙特卡洛树搜索）中独立处理。这样的裁员使搜索过程效率低下。我们提出了基于图的搜索策略，以消除任何中间分子的冗余探索。由于图形上的搜索比在树上更复杂，因此我们进一步采用图形神经网络来指导图形搜索。同时，我们的方法可以在图中搜索一批目标，并在基于树的搜索方法中删除目标间重复。两个数据集的实验结果证明了我们方法的有效性。尤其是在广泛使用的USPTO基准测试中，我们将搜索成功率提高到99.47％，以2.6分提高了先前的最新性能。

translated by 谷歌翻译

OpenQA: Hybrid QA System Relying on Structured Knowledge Base as well as Non-structured Data

Gaochen Wu , Bin Xu , Yuxin Qin , Yang Liu , Lingyu Liu , Ziwei Wang

分类：自然语言处理

2021-12-31

由于关键字相关互联网页面的返回，根据关键字检索的搜索引擎不再适应智能互联网时代的信息获取方式。如何快速，准确和有效地获取来自大规模互联网数据的用户所需的信息已成为迫切需要解决的关键问题之一。我们提出了一个基于结构化KB和非结构化数据的智能质疑答案系统，称为OpenQA，其中用户可以提供查询问题，并且模型可以快速向用户提供准确的答案。我们基于语义解析和深度表示学习的KBQA结构化问题回答，以及基于检索和神经机阅读理解的两级非结构化问题回答，并通过OpenQA中的变压器应答选择模块回归最高概率的最终答案。我们对我们构建的数据集进行了初步实验，实验结果证明了提出的智能问题应答系统的有效性。与此同时，OpenQA平台的每个模块的核心技术仍处于学术热点的最前沿，并基于这些学术热点进一步探索了OpenQA的理论本质和富集。

translated by 谷歌翻译

SPViT: Enabling Faster Vision Transformers via Soft Token Pruning

Zhenglun Kong , Peiyan Dong , Xiaolong Ma , Xin Meng , Wei Niu , Mengshu Sun , Bin Ren , Minghai Qin , Hao Tang , Yanzhi Wang

分类：计算机视觉

2021-12-27

最近，视觉变压器（VIT）在计算机视野中连续建立了新的里程碑，而高计算和内存成本使其在工业生产中的传播困难。修剪是一种用于硬件效率的传统模型压缩范例，已广泛应用于各种DNN结构。尽管如此，它含糊不清，如何在vit结构上进行独家修剪。考虑三个关键点：结构特征，VITS的内部数据模式和相关边缘设备部署，我们利用输入令牌稀疏性并提出了一种计算感知软修剪框架，可以在扁平的vanilla变压器上设置。和CNN型结构，例如基于池的Vit（坑）。更具体地说，我们设计了一种基于动态关注的多头令牌选择器，它是一个轻量级模块，用于自适应实例 - 明智令牌选择。我们进一步引入了一种软修剪技术，它将选择器模块生成的较少的信息令牌集成到将参与后续计算的包令牌，而不是完全丢弃。我们的框架通过我们所提出的计算感知培训策略，我们通过特定边缘设备的准确性和计算限制之间的权衡。实验结果表明，我们的框架显着降低了VIT的计算成本，同时在图像分类上保持了可比性。此外，我们的框架可以保证所识别的模型，以满足移动设备和FPGA的资源规范，甚至在移动平台上实现DEIT-T的实时执行。例如，我们的方法在移动设备上减少了DEIT-T至26毫秒的延迟（26％$ \ SIM 41％的41％），在移动设备上，在0.25％$ \ sim $ 4％的ImageNet上的前1个精度高出4％。我们的代码即将发布。

translated by 谷歌翻译

Task-Oriented Image Transmission for Scene Classification in Unmanned Aerial Systems

Xu Kang , Bin Song , Jie Guo , Zhijin Qin , F. Richard Yu

分类：计算机视觉

2021-12-21

事物互联网的蓬勃发展使得能够将其计算和存储能力扩展到计算空中系统中的任务，其中云和边缘协作，特别是对于基于深度学习（DL）的人工智能（AI）任务。收集大量图像/视频数据，无人驾驶飞行器（UAV）由于其存储和计算能力有限，只能将智能分析任务切换到后端移动边缘计算（MEC）服务器。如何有效地传输AI模型的最相关信息是一个具有挑战性的主题。灵感来自近年来的任务型沟通，我们提出了一个新的空中图像传输范例，用于场景分类任务。在前端UAV上开发了轻量级模型，用于语义块传输，具有对图像和信道条件的看法。为了实现传输延迟和分类准确性之间的权衡，深增强学习（DRL）用于探索在各种信道条件下对后端分类器具有最佳贡献的语义块。实验结果表明，与固定传输策略和传统的内容感知方法相比，该方法可以显着提高分类准确性。

translated by 谷歌翻译

Current State of Community-Driven Radiological AI Deployment in Medical Imaging

Vikash Gupta , Barbaros Selnur Erdal , Carolina Ramirez , Ralf Floca , Laurence Jackson , Brad Genereaux , Sidney Bryson , Christopher P Bridge , Jens Kleesiek , Felix Nensa

分类：人工智能

2022-12-29

Artificial Intelligence (AI) has become commonplace to solve routine everyday tasks. Because of the exponential growth in medical imaging data volume and complexity, the workload on radiologists is steadily increasing. We project that the gap between the number of imaging exams and the number of expert radiologist readers required to cover this increase will continue to expand, consequently introducing a demand for AI-based tools that improve the efficiency with which radiologists can comfortably interpret these exams. AI has been shown to improve efficiency in medical-image generation, processing, and interpretation, and a variety of such AI models have been developed across research labs worldwide. However, very few of these, if any, find their way into routine clinical use, a discrepancy that reflects the divide between AI research and successful AI translation. To address the barrier to clinical deployment, we have formed MONAI Consortium, an open-source community which is building standards for AI deployment in healthcare institutions, and developing tools and infrastructure to facilitate their implementation. This report represents several years of weekly discussions and hands-on problem solving experience by groups of industry experts and clinicians in the MONAI Consortium. We identify barriers between AI-model development in research labs and subsequent clinical deployment and propose solutions. Our report provides guidance on processes which take an imaging AI model from development to clinical implementation in a healthcare institution. We discuss various AI integration points in a clinical Radiology workflow. We also present a taxonomy of Radiology AI use-cases. Through this report, we intend to educate the stakeholders in healthcare and AI (AI researchers, radiologists, imaging informaticists, and regulators) about cross-disciplinary challenges and possible solutions.

translated by 谷歌翻译

Coordination of Drones at Scale: Decentralized Energy-aware Swarm Intelligence for Spatio-temporal Sensing

Chuhao Qin , Evangelos Pournaras

分类：机器人

2022-12-28

Smart City applications, such as traffic monitoring and disaster response, often use swarms of intelligent and cooperative drones to efficiently collect sensor data over different areas of interest and time spans. However, when the required sensing becomes spatio-temporally large and varying, a collective arrangement of sensing tasks to a large number of battery-restricted and distributed drones is challenging. To address this problem, we introduce a scalable and energy-aware model for planning and coordination of spatio-temporal sensing. The coordination model is built upon a decentralized multi-agent collective learning algorithm (EPOS) to ensure scalability, resilience, and flexibility that existing approaches lack of. Experimental results illustrate the outstanding performance of the proposed method compared to state-of-the-art methods. Analytical results contribute a deeper understanding of how coordinated mobility of drones influences sensing performance. This novel coordination solution is applied to traffic monitoring using real-world data to demonstrate a $46.45\%$ more accurate and $2.88\%$ more efficient detection of vehicles as the number of drones become a scarce resource.

translated by 谷歌翻译