智能论文笔记

An Adiabatic Capacitive Artificial Neuron with RRAM-based Threshold Detection for Energy-Efficient Neuromorphic Computing

Sachin Maheshwari , Alexander Serb , Christos Papavassiliou , Themistoklis Prodromakis

分类：神经与进化计算

2022-02-02

为了寻求低功率，以生物启发的计算均基于回忆性和基于成年的人工神经网络（ANN）一直是对硬件实施神经形态计算的焦点的主题。进一步的一步，要求使用绝热计算的再生电容性神经网络，为降低能源消耗提供了诱人的途径，尤其是与“ Memimpedace”元素结合使用时。在这里，我们提出了一种人工神经元，具有绝热的突触电容器，以产生神经元的膜电位。后者通过动态闩锁比较器实现，并使用电阻随机访问存储器（RRAM）设备增强。我们最初的4位绝热电容性神经元概念验证示例显示了90％的突触能量节省。在4个突触/SOMA时，我们已经看到总体减少35％的能量。此外，工艺和温度对4位绝热突触的影响显示，在整个角落100度摄氏时，最大能量变化为30％，而没有任何功能损失。最后，我们对ANN的绝热方法的功效进行了512和1024突触/神经元的测试，最差和最佳的情况突触载荷条件以及可变的均衡电容的可变量化均等能力量化了均衡电容和最佳功率 - 电信频率范围之间的预期权衡。加载（即活动突触的百分比）。

translated by 谷歌翻译

Associative Memories Using Complex-Valued Hopfield Networks Based on Spin-Torque Oscillator Arrays

Nitin Prasad , Prashansa Mukim , Advait Madhavan , Mark D. Stiles

分类：机器学习

2021-12-06

基于旋转扭矩振荡器的复合值Hopfield网络模拟可以恢复相位编码的图像。存储器增强逆变器的序列提供可调谐延迟元件，通过相位转换振荡器的振荡输出来实现复合权重的可调延迟元件。伪逆培训足以存储在一组192个振荡器中，至少代表16 $ \倍数为12个像素图像。恢复图像所需的能量取决于所需的错误级别。对于这里考虑的振荡器和电路，来自理想图像的5％均方方偏差需要大约5 00美元$ S并消耗大约130 NJ。模拟显示，当振荡器的谐振频率可以调整为具有小于10 ^ {-3} $的分数扩展时，网络功能良好，具体取决于反馈的强度。

translated by 谷歌翻译

Cryogenic Neuromorphic Hardware

Md Mazharul Islam , Shamiul Alam , Md Shafayat Hossain , Kaushik Roy , Ahmedullah Aziz

分类：人工智能 | 神经与进化计算

2022-03-25

人工智能革命（AI）提出了巨大的存储和数据处理要求。大量的功耗和硬件开销已成为构建下一代AI硬件的主要挑战。为了减轻这种情况，神经形态计算引起了极大的关注，因为它在功耗非常低的功能方面具有出色的数据处理能力。尽管无情的研究已经进行了多年，以最大程度地减少神经形态硬件的功耗，但我们离达到人脑的能源效率还有很长的路要走。此外，设计复杂性和过程变化阻碍了当前神经形态平台的大规模实现。最近，由于其出色的速度和功率指标，在低温温度中实施神经形态计算系统的概念引起了人们的兴趣。可以设计几种低温装置，可作为具有超低功率需求的神经形态原始设备。在这里，我们全面回顾了低温神经形态硬件。我们将现有的低温神经形态硬件分类为几个分层类别，并根据关键性能指标绘制比较分析。我们的分析简洁地描述了相关电路拓扑的操作，并概述了最先进的技术平台遇到的优势和挑战。最后，我们提供了见解，以规避这些挑战，以实现未来的研究发展。

translated by 谷歌翻译

CMOS-based area-and-power-efficient neuron and synapse circuits for time-domain analog spiking neural networks

Xiangyu Chen , Takeaki Yajima , Hisashi Inoue , Isao H. Inoue , Zolboo Byambadorj , Tetsuya Iizuka

分类：神经与进化计算

2022-08-25

传统的神经结构倾向于通过类似数量（例如电流或电压）进行通信，但是，随着CMOS设备收缩和供应电压降低，电压/电流域模拟电路的动态范围变得更窄，可用的边缘变小，噪声免疫力降低。不仅如此，在常规设计中使用操作放大器（运算放大器）和时钟或异步比较器会导致高能量消耗和大型芯片区域，这将不利于构建尖峰神经网络。鉴于此，我们提出了一种神经结构，用于生成和传输时间域信号，包括神经元模块，突触模块和两个重量模块。所提出的神经结构是由晶体管三极区域的泄漏电流驱动的，不使用操作放大器和比较器，因此与常规设计相比，能够提供更高的能量和面积效率。此外，由于内部通信通过时间域信号，该结构提供了更大的噪声免疫力，从而简化了模块之间的接线。提出的神经结构是使用TSMC 65 nm CMOS技术制造的。拟议的神经元和突触分别占据了127 UM2和231 UM2的面积，同时达到了毫秒的时间常数。实际芯片测量表明，所提出的结构成功地用毫秒的时间常数实现了时间信号通信函数，这是迈向人机交互的硬件储层计算的关键步骤。

translated by 谷歌翻译

HTML版本

Resonant tunnelling diode nano-optoelectronic spiking nodes for neuromorphic information processing

Matěj Hejda , Juan Arturo Alanis , Ignacio Ortega-Piwonka , João Lourenço , José Figueiredo , Julien Javaloyes , Bruno Romeira , Antonio Hurtado

分类：神经与进化计算

2021-07-14

在这项工作中，我们介绍了一种光电尖峰，能够以超速率（$ \ \左右100磅/光学尖峰）和低能耗（$ <$ PJ /秒码）运行。所提出的系统结合了具有负差分电导的可激发谐振隧道二极管（RTD）元件，耦合到纳米级光源（形成主节点）或光电探测器（形成接收器节点）。我们在数值上学习互连的主接收器RTD节点系统的尖峰动态响应和信息传播功能。使用脉冲阈值和集成的关键功能，我们利用单个节点来对顺序脉冲模式进行分类，并对图像特征（边缘）识别执行卷积功能。我们还展示了光学互连的尖峰神经网络模型，用于处理超过10 Gbps的时空数据，具有高推理精度。最后，我们展示了利用峰值定时依赖性可塑性的片外监督的学习方法，使能RTD的光子尖峰神经网络。这些结果证明了RTD尖峰节点用于低占地面积，低能量，高速光电实现神经形态硬件的潜在和可行性。

translated by 谷歌翻译

Artificial optoelectronic spiking neuron based on a resonant tunnelling diode coupled to a vertical cavity surface emitting laser

Matěj Hejda , Ekaterina Malysheva , Dafydd Owen-Newns , Qusay Raghib Ali Al-Taai , Weikang Zhang , Ignacio Ortega-Piwonka , Julien Javaloyes , Edward Wasige , Victor Dolores-Calzadilla , José M. L. Figueiredo

分类：神经与进化计算

2022-06-22

可激发的光电设备代表了在神经形态（脑启发）光子系统中实施人工尖峰神经元的关键构件之一。这项工作介绍并实验研究了用谐振隧穿二极管（RTD）构建的光电 - 光学（O/E/O）人工神经元，该神经元（RTD）耦合到光电探测器作为接收器和垂直腔表面发射激光器作为发射机。我们证明了一个明确定义的兴奋性阈值，在此上面，该神经元在该神经元中产生100 ns的光学尖峰反应，具有特征性的神经样耐受性。我们利用其粉丝功能来执行设备中的重合检测（逻辑和）以及独家逻辑或（XOR）任务。这些结果提供了基于RTD的Spiking光电神经元的确定性触发和任务的首次实验验证，并具有输入和输出光学（I/O）终端。此外，我们还从理论上研究了拟议系统的纳米光子实施的前景，并结合了纳米级RTD元素和纳米剂的整体设计。因此，在未来的神经形态光子硬件中，证明了基于RTD的综合兴奋节点对低足迹，高速光电尖峰神经元的潜力。

translated by 谷歌翻译

Scalable Nanophotonic-Electronic Spiking Neural Networks

Luis El Srouji , Yun-Jhu Lee , Mehmet Berkay On , Li Zhang , S. J. Ben Yoo

分类：神经与进化计算

2022-08-28

尖峰神经网络（SNN）提供了一个新的计算范式，能够高度平行，实时处理。光子设备是设计与SNN计算范式相匹配的高带宽，平行体系结构的理想选择。 CMO和光子元件的协整允许将低损耗的光子设备与模拟电子设备结合使用，以更大的非线性计算元件的灵活性。因此，我们在整体硅光子学（SIPH）过程上设计和模拟了光电尖峰神经元电路，该过程复制了超出泄漏的集成和火（LIF）之外有用的尖峰行为。此外，我们探索了两种学习算法，具有使用Mach-Zehnder干涉法（MZI）网格作为突触互连的片上学习的潜力。实验证明了随机反向传播（RPB）的变体，并在简单分类任务上与标准线性回归的性能相匹配。同时，将对比性HEBBIAN学习（CHL）规则应用于由MZI网格组成的模拟神经网络，以进行随机输入输出映射任务。受CHL训练的MZI网络的性能比随机猜测更好，但不符合理想神经网络的性能（没有MZI网格施加的约束）。通过这些努力，我们证明了协调的CMO和SIPH技术非常适合可扩展的SNN计算体系结构的设计。

translated by 谷歌翻译

Colloquium: Advances in automation of quantum dot devices control

Justyna P. Zwolak , Jacob M. Taylor

分类：计算机视觉 | 机器学习

2021-12-17

量子点（QDS）阵列是一个有前途的候选系统，实现可扩展的耦合码头系统，并用作量子计算机的基本构建块。在这种半导体量子系统中，设备现在具有数十个，必须仔细地将系统仔细设置为单电子制度并实现良好的Qubit操作性能。必要点位置的映射和栅极电压的电荷提出了一个具有挑战性的经典控制问题。随着QD Qubits越来越多的QD Qubits，相关参数空间的增加充分以使启发式控制不可行。近年来，有一个相当大的努力自动化与机器学习（ML）技术相结合的基于脚本的算法。在这一讨论中，我们概述了QD器件控制自动化进展的全面概述，特别强调了在二维电子气体中形成的基于硅和GaAs的QD。将基于物理的型号与现代数值优化和ML相结合，证明在屈服高效，可扩展的控制方面已经证明非常有效。通过计算机科学和ML的理论，计算和实验努力的进一步整合，在推进半导体和量子计算平台方面具有巨大的潜力。

translated by 谷歌翻译

Spike-based local synaptic plasticity: A survey of computational models and neuromorphic circuits

Lyes Khacef , Philipp Klein , Matteo Cartiglia , Arianna Rubino , Giacomo Indiveri , Elisabetta Chicca

分类：神经与进化计算

2022-09-30

Understanding how biological neural networks carry out learning using spike-based local plasticity mechanisms can lead to the development of powerful, energy-efficient, and adaptive neuromorphic processing systems. A large number of spike-based learning models have recently been proposed following different approaches. However, it is difficult to assess if and how they could be mapped onto neuromorphic hardware, and to compare their features and ease of implementation. To this end, in this survey, we provide a comprehensive overview of representative brain-inspired synaptic plasticity models and mixed-signal CMOS neuromorphic circuits within a unified framework. We review historical, bottom-up, and top-down approaches to modeling synaptic plasticity, and we identify computational primitives that can support low-latency and low-power hardware implementations of spike-based learning rules. We provide a common definition of a locality principle based on pre- and post-synaptic neuron information, which we propose as a fundamental requirement for physical implementations of synaptic plasticity. Based on this principle, we compare the properties of these models within the same framework, and describe the mixed-signal electronic circuits that implement their computing primitives, pointing out how these building blocks enable efficient on-chip and online learning in neuromorphic processing systems.

translated by 谷歌翻译

A Ferroelectric Tunnel Junction-based Integrate-and-Fire Neuron

Paolo Gibertini , Luca Fehlings , Suzanne Lancaster , Quang Duong , Thomas Mikolajick , Catherine Dubourdieu , Stefan Slesazeck , Erika Covi , Veeresh Deshpande

分类：神经与进化计算

2022-11-04

Event-based neuromorphic systems provide a low-power solution by using artificial neurons and synapses to process data asynchronously in the form of spikes. Ferroelectric Tunnel Junctions (FTJs) are ultra low-power memory devices and are well-suited to be integrated in these systems. Here, we present a hybrid FTJ-CMOS Integrate-and-Fire neuron which constitutes a fundamental building block for new-generation neuromorphic networks for edge computing. We demonstrate electrically tunable neural dynamics achievable by tuning the switching of the FTJ device.

translated by 谷歌翻译

A Survey of Near-Data Processing Architectures for Neural Networks

Mehdi Hassanpour , Marc Riera , Antonio González

分类：机器学习

2021-12-23

基于von-neumann架构的传统计算系统，数据密集型工作负载和应用程序（如机器学习）和应用程序都是基本上限制的。随着数据移动操作和能量消耗成为计算系统设计中的关键瓶颈，对近数据处理（NDP），机器学习和特别是神经网络（NN）的加速器等非传统方法的兴趣显着增加。诸如Reram和3D堆叠的新兴内存技术，这是有效地架构基于NN的基于NN的加速器，因为它们的工作能力是：高密度/低能量存储和近记忆计算/搜索引擎。在本文中，我们提出了一种为NN设计NDP架构的技术调查。通过基于所采用的内存技术对技术进行分类，我们强调了它们的相似之处和差异。最后，我们讨论了需要探索的开放挑战和未来的观点，以便改进和扩展未来计算平台的NDP架构。本文对计算机学习领域的计算机架构师，芯片设计师和研究人员来说是有价值的。

translated by 谷歌翻译

Neuromorphic Computing and Sensing in Space

Dario Izzo , Alexander Hadjiivanov , Domink Dold , Gabriele Meoni , Emmanuel Blazquez

分类：神经与进化计算 | 人工智能

2022-12-10

The term ``neuromorphic'' refers to systems that are closely resembling the architecture and/or the dynamics of biological neural networks. Typical examples are novel computer chips designed to mimic the architecture of a biological brain, or sensors that get inspiration from, e.g., the visual or olfactory systems in insects and mammals to acquire information about the environment. This approach is not without ambition as it promises to enable engineered devices able to reproduce the level of performance observed in biological organisms -- the main immediate advantage being the efficient use of scarce resources, which translates into low power requirements. The emphasis on low power and energy efficiency of neuromorphic devices is a perfect match for space applications. Spacecraft -- especially miniaturized ones -- have strict energy constraints as they need to operate in an environment which is scarce with resources and extremely hostile. In this work we present an overview of early attempts made to study a neuromorphic approach in a space context at the European Space Agency's (ESA) Advanced Concepts Team (ACT).

translated by 谷歌翻译

A bio-inspired implementation of a sparse-learning spike-based hippocampus memory model

Daniel Casanueva-Morato , Alvaro Ayuso-Martinez , Juan P. Dominguez-Morales , Angel Jimenez-Fernandez , Gabriel Jimenez-Moreno

分类：神经与进化计算 | 机器学习

2022-06-10

更具体地说，神经系统能够简单有效地解决复杂的问题，超过现代计算机。在这方面，神经形态工程是一个研究领域，重点是模仿控制大脑的基本原理，以开发实现此类计算能力的系统。在该领域中，生物启发的学习和记忆系统仍然是要解决的挑战，这就是海马涉及的地方。正是大脑的区域充当短期记忆，从而从大脑皮层的所有感觉核中学习，非结构化和快速存储信息及其随后的回忆。在这项工作中，我们提出了一个基于海马的新型生物启发的记忆模型，具有学习记忆的能力，从提示中回顾它们（与其他内容相关的记忆的一部分），甚至在尝试时忘记记忆通过相同的提示学习其他人。该模型已在使用尖峰神经网络上在大型摩托车硬件平台上实现，并进行了一组实验和测试以证明其正确且预期的操作。所提出的基于SPIKE的内存模型仅在接收输入，能提供节能的情况下才能生成SPIKES，并且需要7个时间步，用于学习步骤和6个时间段来召回以前存储的存储器。这项工作介绍了基于生物启发的峰值海马记忆模型的第一个硬件实现，为开发未来更复杂的神经形态系统的发展铺平了道路。

translated by 谷歌翻译

Process, Bias and Temperature Scalable CMOS Analog Computing Circuits for Machine Learning

Pratik Kumar , Ankita Nandi , Shantanu Chakrabartty , Chetan Singh Thakur

分类：机器学习

2022-05-11

与数字计算相比，模拟计算具有吸引力，因为它可以达到更高的计算密度和更高的能源效率。但是，与数字电路不同，由于晶体管偏置偏差，温度变化和有限的动态范围的差异，传统的模拟计算电路不能轻易地在不同的过程节点上映射。在这项工作中，我们概括了先前报道的基于边缘传播的模拟计算框架，用于设计新颖的\ textit {基于形状的模拟计算}（S-AC）电路，这些电路可以轻松地在不同的过程节点上交叉映射。与数字设计类似的S-AC设计也可以缩放以获得精确，速度和功率。作为概念验证，我们展示了实现机器学习（ML）体系结构中通常使用的数学功能的S-AC电路的几个示例。使用电路模拟，我们证明了电路输入/输出特性从平面CMOS 180NM工艺映射到FinFET 7NM工艺时保持健壮。同样，使用基准数据集，我们证明了基于S-AC的神经网络的分类精度在两个过程中映射到温度变化时仍然坚固。

translated by 谷歌翻译

Shape-Dependent Multi-Weight Magnetic Artificial Synapses for Neuromorphic Computing

Thomas Leonard , Samuel Liu , Mahshid Alamdar , Can Cui , Otitoaleke G. Akinola , Lin Xue , T. Patrick Xiao , Joseph S. Friedman , Matthew J. Marinella , Christopher H. Bennett

分类：神经与进化计算

2021-11-22

在神经形态计算中，人工突触提供了一种基于来自神经元的输入来设置的多重导电状态，类似于大脑。可能需要超出多重权重的突触的附加属性，并且可以取决于应用程序，需要需要从相同材料生成不同的突触行为。这里，我们基于使用磁隧道结和磁畴壁的磁性材料测量人造突触。通过在单个磁隧道结下面的畴壁轨道中制造光刻槽口，我们实现了4-5个稳定的电阻状态，可以使用自旋轨道扭矩电气可重复控制。我们分析几何形状对突触行为的影响，表明梯形装置具有高可控性的不对称性重量，而直线装置具有较高的随机性，但具有稳定的电阻水平。设备数据被输入到神经形态计算模拟器中以显示特定于应用程序突触函数的有用性。实施应用于流式的时尚 - MNIST数据的人工神经网络，我们表明梯形磁突出可以用作高效在线学习的元塑功能。为CiFar-100图像识别实施卷积神经网络，我们表明直流突触由于其电阻水平的稳定性而达到近乎理想的推理精度。这项工作显示多重磁突触是神经形态计算的可行技术，并为新兴人工突触技术提供设计指南。

translated by 谷歌翻译

Gradient-based Neuromorphic Learning on Dynamical RRAM Arrays

Peng Zhou , Jason K. Eshraghian , Dong-Uk Choi , Wei D. Lu , Sung-Mo Kang

分类：神经与进化计算 | 人工智能

2022-06-26

我们提出了Memprop，即采用基于梯度的学习来培训完全的申请尖峰神经网络（MSNNS）。我们的方法利用固有的设备动力学来触发自然产生的电压尖峰。这些由回忆动力学发出的尖峰本质上是类似物，因此完全可区分，这消除了尖峰神经网络（SNN）文献中普遍存在的替代梯度方法的需求。回忆性神经网络通常将备忘录集成为映射离线培训网络的突触，或者以其他方式依靠关联学习机制来训练候选神经元的网络。相反，我们直接在循环神经元和突触的模拟香料模型上应用了通过时间（BPTT）训练算法的反向传播。我们的实现是完全的综合性，因为突触重量和尖峰神经元都集成在电阻RAM（RRAM）阵列上，而无需其他电路来实现尖峰动态，例如模数转换器（ADCS）或阈值比较器。结果，高阶电物理效应被充分利用，以在运行时使用磁性神经元的状态驱动动力学。通过朝着非同一梯度的学习迈进，我们在以前报道的几个基准上的轻巧密集的完全MSNN中获得了高度竞争的准确性。

translated by 谷歌翻译

Energy-Efficient Wake-Up Signalling for Machine-Type Devices Based on Traffic-Aware Long-Short Term Memory Prediction

David E. Ruíz-Guirola , Carlos A. Rodríguez-López , Samuel Montejo-Sánchez , Richard Demo Souza , Onel L. A. López , Hirley Alves

分类：机器学习

2022-06-13

减少能源消耗是低功率机型通信（MTC）网络中的一个紧迫问题。在这方面，旨在最大程度地减少机器型设备（MTD）无线电接口所消耗的能量的唤醒信号（WUS）技术是一种有前途的解决方案。但是，最新的WUS机制使用静态操作参数，因此它们无法有效地适应系统动力学。为了克服这一点，我们设计了一个简单但有效的神经网络，以预测MTC流量模式并相应地配置WU。我们提出的预测WUS（FWUS）利用了基于精确的长期记忆（LSTM） - 基于流量预测，该预测允许通过避免在闲置状态下的频繁页面监视场合来延长MTD的睡眠时间。仿真结果显示了我们方法的有效性。流量预测错误显示为4％以下，分别为错误警报和错过检测概率低于8.8％和1.3％。在减少能源消耗方面，FWUS的表现可以胜过高达32％的最佳基准机制。最后，我们证明了FWUS动态适应交通密度变化的能力，促进了低功率MTC可伸缩性

translated by 谷歌翻译

Constraints on the design of neuromorphic circuits set by the properties of neural population codes

Stefano Panzeri , Ella Janotte , Alejandro Pequeño-Zurro , Jacopo Bonato , Chiara Bartolozzi

分类：神经与进化计算

2022-12-08

In the brain, information is encoded, transmitted and used to inform behaviour at the level of timing of action potentials distributed over population of neurons. To implement neural-like systems in silico, to emulate neural function, and to interface successfully with the brain, neuromorphic circuits need to encode information in a way compatible to that used by populations of neuron in the brain. To facilitate the cross-talk between neuromorphic engineering and neuroscience, in this Review we first critically examine and summarize emerging recent findings about how population of neurons encode and transmit information. We examine the effects on encoding and readout of information for different features of neural population activity, namely the sparseness of neural representations, the heterogeneity of neural properties, the correlations among neurons, and the time scales (from short to long) at which neurons encode information and maintain it consistently over time. Finally, we critically elaborate on how these facts constrain the design of information coding in neuromorphic circuits. We focus primarily on the implications for designing neuromorphic circuits that communicate with the brain, as in this case it is essential that artificial and biological neurons use compatible neural codes. However, we also discuss implications for the design of neuromorphic systems for implementation or emulation of neural computation.

translated by 谷歌翻译

Phenomenological modeling of diverse and heterogeneous synaptic dynamics at natural density

Agnes Korcsak-Gorzo , Charl Linssen , Jasper Albers , Stefan Dasbach , Renato Duarte , Susanne Kunkel , Abigail Morrison , Johanna Senk , Jonas Stapmanns , Tom Tetzlaff

分类：神经与进化计算

2022-12-10

This chapter sheds light on the synaptic organization of the brain from the perspective of computational neuroscience. It provides an introductory overview on how to account for empirical data in mathematical models, implement them in software, and perform simulations reflecting experiments. This path is demonstrated with respect to four key aspects of synaptic signaling: the connectivity of brain networks, synaptic transmission, synaptic plasticity, and the heterogeneity across synapses. Each step and aspect of the modeling and simulation workflow comes with its own challenges and pitfalls, which are highlighted and addressed in detail.

translated by 谷歌翻译

A Heterogeneous In-Memory Computing Cluster For Flexible End-to-End Inference of Real-World Deep Neural Networks

Angelo Garofalo , Gianmarco Ottavi , Francesco Conti , Geethan Karunaratne , Irem Boybat , Luca Benini , Davide Rossi

分类：机器学习 | 神经与进化计算

2022-01-04

在小型电池约束的物流设备上部署现代TinyML任务需要高计算能效。使用非易失性存储器（NVM）的模拟内存计算（IMC）承诺在深神经网络（DNN）推理中的主要效率提高，并用作DNN权重的片上存储器存储器。然而，在系统级别尚未完全理解IMC的功能灵活性限制及其对性能，能量和面积效率的影响。为了目标实际的端到端的IOT应用程序，IMC阵列必须括在异构可编程系统中，引入我们旨在解决这项工作的新系统级挑战。我们介绍了一个非均相紧密的聚类架构，整合了8个RISC-V核心，内存计算加速器（IMA）和数字加速器。我们在高度异构的工作负载上基准测试，例如来自MobileNetv2的瓶颈层，显示出11.5倍的性能和9.5倍的能效改进，而在核心上高度优化并行执行相比。此外，我们通过将我们的异构架构缩放到多阵列加速器，探讨了在IMC阵列资源方面对全移动级DNN（MobileNetv2）的端到端推断的要求。我们的结果表明，我们的解决方案在MobileNetv2的端到端推断上，在执行延迟方面比现有的可编程架构更好，比最先进的异构解决方案更好的数量级集成内存计算模拟核心。

translated by 谷歌翻译