智能论文笔记

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

Faith: An Efficient Framework for Transformer Verification on GPUs

Boyuan Feng , Tianqi Tang , Yuke Wang , Zhaodong Chen , Zheng Wang , Shu Yang , Yuan Xie , Yufei Ding

分类：机器学习

2022-09-23

变压器验证引起了机器学习研究和行业的越来越多的关注。它正式验证了变压器对对抗性攻击的鲁棒性，例如用同义词交换单词。但是，由于以中线为中心的计算，变压器验证的性能仍然不令人满意，这与标准神经网络有显着差异。在本文中，我们提出了信仰，这是用于GPU的变压器验证的有效框架。我们首先提出一个语义意识的计算图转换，以识别语义信息，例如变压器验证中的结合计算。我们利用此类语义信息，以在计算图级别启用有效的内核融合。其次，我们提出了一个验证专门的内核手工艺品，以有效地将变压器验证映射到现代GPU。该手工艺者利用了一组GPU硬件支持，以加速通常是内存密集型的验证专业操作。第三，我们提出了一个专家指导的自动调整，以纳入有关GPU后端的专家知识，以促进大型搜索空间探索。广泛的评估表明，Faith在最先进的框架上实现了$ 2.1 \ times $至$ 3.4 \ times $（$ 2.6 \ times $）的加速。

translated by 谷歌翻译

WikiLink: an encyclopedia-based semantic network for design innovation

Haoyu Zuo , Qianzhi Jing , Tianqi Song , Huiting Liu , Lingyun Sun , Peter Childs , Liuqing Chen

分类：自然语言处理

2022-08-30

数据驱动的设计和创新是重复使用和提供宝贵和有用信息的过程。但是，现有的设计创新语义网络基于仅限于技术和科学信息的数据源。此外，现有研究仅在统计或语义关系上建立语义网络的边缘，这不太可能充分利用两种类型的关系中的好处，并发现设计创新的隐性知识。因此，我们构建了基于Wikipedia的语义网络Wikilink。 Wikilink引入了概念之间的统计重量和语义权重的合并重量，并开发了四种算法来启发新想法。进行评估实验，结果表明，该网络的特征是术语，关系和学科的高度覆盖范围，这证明了网络的有效性和实用性。然后，演示和案例研究结果表明，Wikilink可以作为概念设计创新的思想生成工具。 Wikilink的源代码和后端数据提供开源，供更多用户探索和构建。

translated by 谷歌翻译

HTML版本

SONAR: Joint Architecture and System Optimization Search

Elias Jääsaari , Michelle Ma , Ameet Talwalkar , Tianqi Chen

分类：机器学习

2022-08-25

越来越需要在各种新的硬件平台上为不同任务部署机器学习。这样的部署场景需要应对多个挑战，包括确定可以实现合适的预测准确性（体系结构搜索）的模型体系结构，并找到有效的模型实施，以满足基础硬件特定的系统约束，例如延迟（系统优化搜索）。现有作品将架构搜索和系统优化搜索视为单独的问题，并将其顺序解决。在本文中，我们建议共同解决这些问题，并引入一种简单但有效的基线方法，称为Sonar，该方法交织了这两个搜索问题。 Sonar的目标是通过将早期停止应用于两个搜索过程来有效地优化预测准确性和推理潜伏期。我们对多个不同硬件后端的实验表明，Sonar识别出几乎最佳体系结构的速度比蛮力方法快30倍。

translated by 谷歌翻译

HTML版本

Spectrum of non-Hermitian deep-Hebbian neural networks

Zijian Jiang , Ziming Chen , Tianqi Hou , Haiping Huang

分类： (统计)机器学习

2022-08-24

具有复发性不对称耦合的神经网络对于了解如何在大脑中编码情节记忆很重要。在这里，我们将广泛的突触整合窗口的实验性观察整合到连续时间动力学中的序列检索模型中。理论上通过得出神经动力学中的雅可比矩阵的随机基质理论来研究具有非正态神经元相互作用的模型。这些光谱具有几个不同的特征，例如围绕原点的旋转对称性以及光谱边界内嵌套空隙的出现。因此，光谱密度高度不均匀地分布在复杂平面中。随机矩阵理论还可以预测过渡到混乱。特别是，混乱的边缘为记忆的顺序检索提供了计算益处。我们的工作提供了与任意时间延迟的时间隔离相关性的系统研究，因此可以激发对广泛记忆模型的未来研究，甚至可以激发生物学时间序列的大数据分析。

translated by 谷歌翻译

HTML版本

SparseTIR: Composable Abstractions for Sparse Compilation in Deep Learning

Zihao Ye , Ruihang Lai , Junru Shao , Tianqi Chen , Luis Ceze

分类：机器学习 | 人工智能

2022-07-11

稀疏的张量正在迅速成为现代深度学习工作负载的关键组成部分。但是，开发高性能的稀疏运营商可能很困难和乏味，现有的供应商库无法满足新运营商的不断升级要求。稀疏张量编译器简化了操作员的开发，但是对深度学习的有效稀疏编译仍然具有挑战性，因为单个稀疏格式无法最大程度地提高硬件效率，并且单次弹出编译器无法跟上最新的硬件和系统进步。我们表明，解决这两个挑战的关键是两种合成性。在本文中，我们提出了SparSetir，这是一种稀疏的张张汇编抽象，可为深度学习工作负载提供可合理的格式和可组合的转换。 Sparsetir在这些可组合组件上构建一个搜索空间，以进行性能调整。通过这些改进，SparSetir获得了单个操作员的GPU上的一致性能加速与供应商库：GNN操作员的1.1-3.3倍，稀疏变压器操作员的1.1-4.4x。 Sparsetir还以1.1-2.2倍的速度加速了端到端GNN，用于图形训练，而RGCN推断为0.9-26x。

translated by 谷歌翻译

TensorIR: An Abstraction for Automatic Tensorized Program Optimization

Siyuan Feng , Bohan Hou , Hongyi Jin , Wuwei Lin , Junru Shao , Ruihang Lai , Zihao Ye , Lianmin Zheng , Cody Hao Yu , Yong Yu

分类：机器学习 | 人工智能

2022-07-09

在各种设备上部署深度学习模型已成为一个重要的话题。硬件专业化的浪潮为多维张量计算带来了一套多样化的加速度原始图。这些新的加速原始基原料以及新兴的机器学习模型带来了巨大的工程挑战。在本文中，我们提出了Tensorir，这是一种编译器抽象，用于通过这些张量计算原始素优化程序。Tensorir概括了现有机器学习编译器中使用的循环巢表示，以将张量计算作为一流的公民。最后，我们在抽象之上构建了一个端到端框架，以自动优化给定的张量计算原始图的深度学习模型。实验结果表明，Tensorir编译会自动使用给定硬件后端的张量计算原始图，并提供与跨平台的最新手工精制系统竞争性能的性能。

translated by 谷歌翻译

Collage: Automated Integration of Deep Learning Backends

Byungsoo Jeon , Sunghyun Park , Peiyuan Liao , Sheng Xu , Tianqi Chen , Zhihao Jia

分类：机器学习 | 人工智能

2021-11-01

对深度学习的有效部署的强烈需求（DL）应用促使丰富的DL生态系统的快速发展。为了跟上其快速进步，对于DL框架来说至关重要，以有效地将各种优化的库和运行时作为其后端集成，并通过正确使用它们来生成最快的可执行文件。但是，当前的DL框架需要重大的手动努力来整合多样化的后果，并且通常无法提供高性能。在本文中，我们提出了一个用于集成DL后端的自动框架的拼贴画。拼贴提供后端注册界面，允许用户精确指定各个后端的功能。通过利用可用后端的规范，拼贴搜索给定工作负载和执行环境的优化后端放置。我们的评估表明，拼贴画在没有手动干预的情况下将多个后端集成在一起，并且分别在两个不同的NVIDIA GPU和英特尔CPU上以1.21倍，1.39倍，1.40倍的现有框架。

translated by 谷歌翻译

ASK: Adversarial Soft k-Nearest Neighbor Attack and Defense

Ren Wang , Tianqi Chen , Philip Yao , Sijia Liu , Indika Rajapakse , Alfred Hero

分类：机器学习 | 人工智能

2021-06-27

基于K-Nearest的邻居（KNN）的深度学习方法，由于其简单性和几何解释性，已应用于许多应用。但是，尚未对基于KNN的分类模型的鲁棒性进行彻底探索，而KNN攻击策略欠发达。在本文中，我们提出了对敌对的软knn（询问）损失，以设计更有效的KNN攻击策略，并为他们提供更好的防御能力。我们的问损失方法有两个优势。首先，与以前的作品中提出的目标相比，问问损失可以更好地近似KNN分类错误的可能性。其次，询问损失是可以解释的：它保留了扰动输入和课堂参考数据之间的相互信息。我们使用询问损失来生成一种名为Ask-Attack（Ask-ATK）的新颖攻击方法，该方法显示出相对于先前的KNN攻击，显示出了卓越的攻击效率和准确性降解。然后，基于Ask-ATK，我们得出了一个Ask \ supessline {def} ense（ask-def）方法，该方法优化了Ask-ATK引起的最坏情况训练损失。 CIFAR-10（IMAGENET）上的实验表明，（i）Ask-Atk成就$ \ geq 13 \％$（$ \ geq 13 \％$）提高了先前的KNN攻击的攻击成功率，以及（ii）ask-def $ \ geq 6.9 \％$（$ \ geq 3.5 \％$）在稳健性改善方面胜过常规的对抗训练方法。

translated by 谷歌翻译

TVM: An Automated End-to-End Optimizing Compiler for Deep Learning

Tianqi Chen , Thierry Moreau , Ziheng Jiang , Lianmin Zheng , Eddie Yan , Meghan Cowan , Haichen Shen , Leyuan Wang , Yuwei Hu , Luis Ceze

分类：

2018-02-12

There is an increasing need to bring machine learning to a wide diversity of hardware devices. Current frameworks rely on vendor-specific operator libraries and optimize for a narrow range of server-class GPUs. Deploying workloads to new platforms -such as mobile phones, embedded devices, and accelerators (e.g., FPGAs, ASICs) -requires significant manual effort. We propose TVM, a compiler that exposes graph-level and operator-level optimizations to provide performance portability to deep learning workloads across diverse hardware back-ends. TVM solves optimization challenges specific to deep learning, such as high-level operator fusion, mapping to arbitrary hardware primitives, and memory latency hiding. It also automates optimization of low-level programs to hardware characteristics by employing a novel, learning-based cost modeling method for rapid exploration of code optimizations. Experimental results show that TVM delivers performance across hardware back-ends that are competitive with state-ofthe-art, hand-tuned libraries for low-power CPU, mobile GPU, and server-class GPUs. We also demonstrate TVM's ability to target new accelerator back-ends, such as the FPGA-based generic deep learning accelerator.The system is open sourced and in production use inside several major companies.

translated by 谷歌翻译