Dynamic neural networks (DyNNs) have become viable techniques to enable intelligence on resource-constrained edge devices while maintaining computational efficiency. In many cases, the implementation of DyNNs can be sub-optimal due to its underlying backbone architecture being developed at the design stage independent of both: (i) the dynamic computing features, e.g. early exiting, and (ii) the resource efficiency features of the underlying hardware, e.g., dynamic voltage and frequency scaling (DVFS). Addressing this, we present HADAS, a novel Hardware-Aware Dynamic Neural Architecture Search framework that realizes DyNN architectures whose backbone, early exiting features, and DVFS settings have been jointly optimized to maximize performance and resource efficiency. Our experiments using the CIFAR-100 dataset and a diverse set of edge computing platforms have seen HADAS dynamic models achieve up to 57% energy efficiency gains compared to the conventional dynamic ones while maintaining the desired level of accuracy scores. Our code is available at https://github.com/HalimaBouzidi/HADAS
translated by 谷歌翻译
由于自动驾驶应用程序的高性能和安全要求,现代自动驾驶系统(AD)的复杂性一直在增长,刺激了对更复杂的硬件的需求,这可能会增加广告平台的能量足迹。在解决此问题时,Edge Computing有望包含自动驾驶应用程序,从而使计算密集型的自治任务能够在计算能力的边缘服务器下进行处理。但是,除了严格的鲁棒性需求外,ADS平台的复杂硬件体系结构还阐明了自动驾驶独有的任务卸载并发症。因此,我们提出了$ romanus $,这是一种具有多传感器处理管道的模块化广告平台的可靠和高效任务的方法。我们的方法论需要两个阶段:(i)沿相关深度学习模型的执行路径引入有效的卸载点,以及(ii)基于深度强化学习的运行时解决方案的实现,以根据在操作模式下根据变化的变化来调整操作模式。感知到的道路场景复杂性,网络连接和服务器负载。对象检测用例的实验表明,我们的方法比纯局部执行高14.99%,同时从强大的不稳定卸载基线中降低了危险行为的77.06%。
translated by 谷歌翻译
综合电路(IC)供应链的全球化已将大部分设计,制造和测试过程从单一的受信任实体转移到全球各种不信任的第三方实体。使用不信任的第三方知识产权(3PIP)的风险是,对手可能会插入称为硬件木马(HTS)的恶意修改。这些HT可以损害完整性,恶化性能,拒绝服务并改变设计的功能。尽管文献中已经提出了许多HT检测方法,但HT定位的关键任务被忽略了。此外,一些现有的HT本地化方法具有多个弱点:依赖黄金参考,无法概括所有类型的HT,缺乏可扩展性,低位置分辨率以及手动功能工程/属性定义。为了克服他们的缺点,我们通过利用图形卷积网络(GCN)提出了一种新颖的,无参考的HT定位方法。在这项工作中,我们将电路设计转换为其内在数据结构,绘制并提取节点属性。之后,图形卷积对节点进行自动提取,以将节点分类为特洛伊木马或良性。我们的自动化方法不会通过手动代码审查来负担设计师的负担。它以99.6%的精度,93.1%的F1得分和假阳性速率低于0.009%的速率定位特洛伊木马信号。
translated by 谷歌翻译
可穿戴设备和医疗器互联网(IOMT)的最新发展允许实时监控和记录心电图(ECG)信号。然而,由于能量和内存约束,对ECG信号的连续监测在低功耗可穿戴设备中具有挑战性。因此,在本文中,我们提出了一种新颖和节能的方法,用于连续监测低功耗可穿戴设备的心脏。所提出的方法由三个不同的层组成:1)噪声/伪像检测层,以级别ECG信号的质量; 2)正常/异常拍摄分类层以检测心电图信号中的异常,3)异常搏动分类层以检测来自ECG信号的疾病。此外,分布式多输出卷积神经网络(CNN)架构用于降低边缘/云之间的能量消耗和等待时间。我们的方法论在众所周知的MIT-BIH心律失常数据集上达到了99.2%的准确性。 Real硬件的评估表明,我们的方法是适用于具有32KB最小RAM的设备。此外,与最先进的工作相比,所提出的方法可以获得7美元的能效。
translated by 谷歌翻译
最近,已经证明了与图形学习技术结合使用的道路场景图表示,在包括动作分类,风险评估和碰撞预测的任务中优于最先进的深度学习技术。为了使Road场景图形表示的应用探索,我们介绍了RoadScene2VEC:一个开源工具,用于提取和嵌入公路场景图。 RoadScene2VEC的目标是通过提供用于生成场景图的工具,为生成时空场景图嵌入的工具以及用于可视化和分析场景图的工具来实现Road场景图的应用程序和能力基于方法。 RoadScene2VEC的功能包括(i)来自Carla Simulator的视频剪辑或数据的自定义场景图,(ii)多种可配置的时空图嵌入模型和基于基于基于CNN的模型,(iii)内置功能使用图形和序列嵌入用于风险评估和碰撞预测应用,(iv)用于评估转移学习的工具,以及(v)用于可视化场景图的实用程序,并分析图形学习模型的解释性。我们展示了道路展示的效用,用于这些用例,具有实验结果和基于CNN的模型的实验结果和定性评估。 Rodscene2vec可在https://github.com/aicps/roadscene2vec提供。
translated by 谷歌翻译
人类活动识别(HAR)是健康监测的关键应用之一,需要连续使用可穿戴设备来跟踪日常活动。本文提出了一种适用于适用于低功率边缘装置的节能HAR(AHAR)的自适应CNN。与传统的早期退出架构不同,这是基于分类信心的出口决策,AHAR提出了一种新的自适应架构,其使用输出块预测器选择在推理阶段期间使用的基线架构的一部分。实验结果表明,传统的早期退出架构遭受性能损失,而我们的自适应架构提供类似或更好的性能作为基线,同时节能。我们验证了从两个数据集合机会和W-Har分类机置活动的方法。与机会数据集的雾/云计算方法相比,我们的基线和自适应架构分别显示了相当的加权F1得分为91.79%,分别为91.57%。对于W-HAR数据集,我们的基线和自适应架构分别优于最先进的工程,其加权F1分别为97.55%和97.64%。与机会数据集的作品相比,真实硬件对真实硬件的评估表明,我们的基线架构是显着的节能(少422.38倍)和记忆效率(14.29倍)。对于W-Har DataSet,与最先进的工作相比,我们的基线架构需要2.04倍的能量和2.18倍的内存。此外,实验结果表明,我们的自适应架构是12.32%(机会)和11.14%(W-HAR)的节能,而不是我们的基线,同时提供类似的(机会)或更好的(W-HAR)性能,没有显着的记忆开销。
translated by 谷歌翻译
在自动车辆(AVS)中,预警系统依赖于碰撞预测,以确保乘员安全。然而,使用深度卷积网络的最先进的方法在建模冲突中失败或者太昂贵/慢,使它们不太适合在AV边缘硬件上部署。为了解决这些限制,我们提出了SG2VEC,一种使用图形神经网络(GNN)和长短期内存(LSTM)层的时空场景图嵌入方法,以通过视觉场景感知来预测未来的碰撞。我们展示SG2VEC预测碰撞8.11%,比综合数据集的最新方法提前39.07%,在挑战现实世界碰撞数据集中更准确地进行29.47%。我们还表明,SG2VEC在将知识从合成数据集转移到现实世界驾驶数据集时更好。最后,我们证明SG2VEC更快地执行推论9.3X,较小的型号为88.0%,功率少32.4%,而且能量少于行业标准的NVIDIA驱动PX 2平台,制作它更适合在边缘实施。
translated by 谷歌翻译
自动许可板识别系统旨在提供从视频帧中出现的车辆检测,本地化和识别车牌字符的解决方案。但是,在现实世界中部署此类系统需要在低资源环境中实时性能。在我们的论文中,我们提出了一种双级检测管线与视觉API配对,提供实时推理速度以及始终如一的准确检测和识别性能。我们使用Haar-Cascade分类器作为骨干MobileNet SSDv2检测模型顶部的过滤器。这仅通过专注于高置信度检测并使用它们来识别来减少推理时间。我们还施加了一个时间帧分离策略,以区分同一夹子中的多个车辆牌照。此外,没有公开的Bangla许可证板数据集,我们创建了一个图像数据集和野外包含许可板的视频数据集。我们在图像数据集上培训了模型,并达到了86%的AP(0.5)得分,并在视频数据集上测试了我们的管道,并观察到合理的检测和识别性能(82.7%的检测率,60.8%OCR F1得分)具有真实 - 时间处理速度(每秒27.2帧)。
translated by 谷歌翻译
Handwriting Recognition has been a field of great interest in the Artificial Intelligence domain. Due to its broad use cases in real life, research has been conducted widely on it. Prominent work has been done in this field focusing mainly on Latin characters. However, the domain of Arabic handwritten character recognition is still relatively unexplored. The inherent cursive nature of the Arabic characters and variations in writing styles across individuals makes the task even more challenging. We identified some probable reasons behind this and proposed a lightweight Convolutional Neural Network-based architecture for recognizing Arabic characters and digits. The proposed pipeline consists of a total of 18 layers containing four layers each for convolution, pooling, batch normalization, dropout, and finally one Global average pooling and a Dense layer. Furthermore, we thoroughly investigated the different choices of hyperparameters such as the choice of the optimizer, kernel initializer, activation function, etc. Evaluating the proposed architecture on the publicly available 'Arabic Handwritten Character Dataset (AHCD)' and 'Modified Arabic handwritten digits Database (MadBase)' datasets, the proposed model respectively achieved an accuracy of 96.93% and 99.35% which is comparable to the state-of-the-art and makes it a suitable solution for real-life end-level applications.
translated by 谷歌翻译
评估网络协议的真实表现是具有挑战性的。随机控制试验(RCT)对大多数研究人员来说是昂贵的并且无法进入,而专业设计的模拟器则无法捕获真实网络中的复杂行为。我们呈现MaunAlim,一种数据驱动的模拟器,用于解决这一挑战的网络协议。由于数据收集期间使用的协议引入的偏差,从观察数据中学习网络行为是复杂的。 MakAlAIM在一组协议下使用来自初始RCT的迹线来学习因果网络模型,有效地去除数据中存在的偏差。然后,使用此模型,可以在同一迹线上模拟任何协议(即,用于反事实预测)。因果的关键是对来自来自RCT的训练数据引起的分布修正因的对抗性神经网络培训进行了新的使用。我们对实际和合成数据集的MAURALAIM的广泛评估以及来自河豚视频流系统的两种用例,包括来自河豚视频流系统的超过九个月的实际数据,表明它提供了准确的反事预测,将预测误差降低了44%和53%平均值与专家设计和标准的监督学习基线相比。
translated by 谷歌翻译