确实,卷积神经网络(CNN)更合适。然而,固定内核大小使传统的CNN太具体,既不灵活也不有利于特征学习,从而影响分类准确性。不同内核大小网络的卷积可以通过捕获更多辨别和相关信息来克服这个问题。鉴于此,所提出的解决方案旨在将3D和2D成立网的核心思想与促进混合方案中的HSIC CNN性能提升。生成的\ Textit {注意融合混合网络}(AFNET)基于三个关注融合的并行混合子网,每个块中的不同内核使用高级功能,以增强最终的地面图。简而言之,AFNET能够选择性地过滤滤除对分类至关重要的辨别特征。与最先进的模型相比,HSI数据集的几次测试为AFNET提供了竞争力的结果。拟议的管道实现,实际上,印度松树的总体准确性为97 \%,博茨瓦纳100 \%,帕尔茨大学,帕维亚中心和萨利纳斯数据集的99 \%。
translated by 谷歌翻译
在医学领域,MRI的地标检测在减少扫描计划,图像登记等中的任务中减少医疗技术人员努力方面发挥着重要作用。首先,88个地标在三个相应的观点中分布在三个相应的观点中 - 矢状,冠状动脉和轴向手动注释,专家临床技术人员的后期准则被划分解剖学,以便更好地定位现有地标,以便即使在斜扫描中也定位重要的地图标志性地标。为了克服有限的数据可用性,我们实施现实的数据增强以生成合成3D容量数据。我们使用修改后的HIGHRES3DNET模型来解决脑MRI容量的地标检测问题。为了在视觉上解释我们的培训模型,并从较弱的模型中辨别更强的模型,我们实现了梯度加权类激活映射(GRAC-CAM),它产生突出显示模型聚焦的区域的粗糙定位图。我们的实验表明,该方法显示出有利的结果,并且整个管道可以扩展到可变数量的地标和其他解剖。
translated by 谷歌翻译
在CT图像中与Covid-19相关联的肺病变的自动分割需要大量的注释体积。注释授权专家知识,并通过全部手动分割方法获得时间密集。另外,肺病变具有大的患者间变异,具有与健康肺组织相似的视觉外观的病理学。当应用数据标签时,在应用现有的半自动交互式分段技术时,这会带来挑战。为了解决这些挑战,我们提出了一个有效的卷积神经网络(CNNS),可以在注释者提供基于杂交的交互时在线学习。为了从仅通过用户交互标记的样本加速学习,基于补丁的方法用于训练网络。此外,我们使用加权交叉熵丢失来解决可能由用户交互导致的类别不平衡。在线推理期间,使用完全卷积的方法将学习网络应用于整个输入卷。我们将建议的方法与最先进的方法进行比较,并表明它优于与Covid-19相关联的肺病变的任务表现出现有的方法,在减少3美元\ Times $减少执行时间的同时实现16%的骰子分数。需要9000个较小的基于血小板的标记体素。由于在线学习方面,我们的方法将快速适应用户输入,从而产生高质量的细分标签。源代码将在接受时提供。
translated by 谷歌翻译
过去十年迅速采用了人工智能(AI),特别是深度学习网络,在医学互联网上(IOMT)生态系统。然而,最近已经表明,深度学习网络可以通过对抗性攻击来利用,这不仅使得IOMT易受数据盗窃,而且对医学诊断的操纵。现有的研究考虑将噪声添加到原始IOMT数据或模型参数中,这不仅可以降低医学推断的整体性能,而且对从梯度方法的深度泄漏的喜好是无效的。在这项工作中,我们提出了近端渐变分流学习(PSGL)方法,用于防范模型反演攻击。所提出的方法故意在客户端进行深度神经网络培训过程时攻击IOMT数据。我们建议使用近端梯度方法来恢复梯度图和决策级融合策略以提高识别性能。广泛的分析表明,PGSL不仅为模型反演攻击提供有效的防御机制,而且有助于提高公共可用数据集的识别性能。我们分别在重建和对冲攻击图像中准确地报告17.9美元\%$和36.9美元。
translated by 谷歌翻译
当地球经历全球变暖时,自然灾害,如洪水,龙卷风或野火,越来越普遍普遍。很难预测事件的何时何时会发生,所以及时的应急响应对于拯救受破坏事件危害的人的生命至关重要。幸运的是,技术可以在这些情况下发挥作用。社交媒体帖子可以用作低延迟数据源来了解灾难的进展和后果,但解析此数据无需自动化方法。在前的工作主要集中在基于文本的过滤,但基于图像和基于视频的过滤仍然很大程度上是未开发的。在这项工作中,我们介绍了一个大规模的多标签数据集,其中包含977,088个图像,43个事件和49个地方。我们提供数据集建设,统计和潜在偏差的详细信息;介绍和训练事件检测模型;在Flickr和Twitter上为数百万图像进行图像过滤实验。我们还提出了一些关于事件分析的申请,以鼓励和使未来的人道主义援助中的计算机愿景工作。代码,数据和模型可在http://incidentsdataset.csail.mit.edu上获得。
translated by 谷歌翻译
使用社交媒体网站和应用程序已经变得非常受欢迎,人们在这些网络上分享他们的照片。在这些网络上自动识别和标记人们的照片已经提出了隐私保存问题,用户寻求隐藏这些算法的方法。生成的对抗网络(GANS)被证明是非常强大的在高多样性中产生面部图像以及编辑面部图像。在本文中,我们提出了一种基于GAN的生成掩模引导的面部图像操纵(GMFIM)模型,以将无法察觉的编辑应用于输入面部图像以保护图像中的人的隐私。我们的模型由三个主要组件组成:a)面罩模块将面积从输入图像中切断并省略背景,b)用于操纵面部图像并隐藏身份的GaN的优化模块,并覆盖身份和c)用于组合输入图像的背景和操纵的去识别的面部图像的合并模块。在优化步骤的丢失功能中考虑了不同的标准,以产生与输入图像一样类似的高质量图像,同时不能通过AFR系统识别。不同数据集的实验结果表明,与最先进的方法相比,我们的模型可以实现对自动面部识别系统的更好的性能,并且它在大多数实验中捕获更高的攻击成功率。此外,我们提出的模型的产生图像具有最高的质量,更令人愉悦。
translated by 谷歌翻译
Landslides在人为全球变暖时代的人类生活和财产的常规发生和令人震惊的威胁。利用数据驱动方法早日预测利用数据驱动方法是时间的要求。在这项研究中,我们探讨了最能描述Landslide易感性与最先进的机器学习方法的雄辩功能。在我们的研究中,我们采用了最先进的机器学习算法,包括XGBoost,LR,KNN,SVM,Adaboost用于滑坡敏感性预测。要查找每个单独分类器的最佳超级参数以优化性能,我们已纳入网格搜索方法,交叉验证10倍。在这种情况下,XGBoost的优化版本优先于所有其他分类器,交叉验证加权F1得分为94.62%。其次是通过合并Treeshap并识别斜坡,高度,TWI等雄辩的特征来探索XGBoost分类器,这些特征在于,XGBoost分类器的性能大多是Landuse,NDVI,SPI等功能,这对模型性能较小。 。根据Treeshap的特征说明,我们选择了15个最重要的滑坡因果因素。显然,XGBoost的优化版本随着特征减少40%,在具有十字架的流行评估度量方面表现优于所有其他分类器。 - 在培训和AUC分数的加权F1得分为95.01%,AUC得分为97%。
translated by 谷歌翻译
肺部疾病会导致严重的呼吸问题,如果未及时治疗,导致猝死。许多研究人员利用深度学习系统使用胸部X射线(CXRS)诊断肺疾病。然而,这种系统需要在大规模数据上进行详尽的培训,以有效地诊断胸部异常。此外,采购这种大规模数据通常是不可行的和不切实际的,特别是对于罕见疾病。随着较近的增量学习的进步,研究人员定期调整了深度神经网络,以了解不同的训练示例。虽然,这种系统可以抵抗灾难性的遗忘,但它们彼此独立地对待知识表示,并且这限制了它们的分类性能。此外,据我们所知,没有增量学习驱动的图像诊断框架,专门用于筛选来自CXR的肺部障碍。为了解决这个问题,我们提出了一种新颖的框架,可以学会逐步逐步筛选不同的胸部异常。除此之外,拟议的框架通过增量学习损失函数,即在逐步学习的知识表示之间识别逐步学习知识表示之间的结构和语义互相依赖性,无论扫描仪规格如何,都会识别逐步学习的知识表示之间的结构和语义相互作用。我们在包含不同胸部异常的五个公共CXR数据集上测试了拟议的框架,其中它通过各种指标表现出各种最先进的系统。
translated by 谷歌翻译
可穿戴电子设备不断发展,正在增加人类与技术的集成。以各种形式提供,这些灵活和可弯曲的设备感觉,可以测量人体的生理和肌肉变化,并可以将这些信号用于机器控制。Myo手势频带,一个这样的设备,使用磁电信号捕获电拍摄数据(EMG)并将其转换为通过一些预定义手势用作输入信号。在多模态环境中使用此设备不仅可以增加可以在此类设备的帮助下实现的可能类型的工作类型,而且还可以帮助提高所执行任务的准确性。本文解决了通过麦克风和肌电信号捕获的输入模态的融合,分别通过麦克风和Myo带,以控制机器人臂。还提出了所获得的实验结果以及它们的性能分析的准确性。
translated by 谷歌翻译
本研究专注于评估智能和安全车辆系统的热对象检测的实时性能,通过在GPU和单板边缘GPU计算平台上部署训练有素的网络进行车载汽车传感器套件测试。在充满挑战的天气和环境场景中,获取,加工和开放,包括具有> 35,000个不同框架的新型大规模热数据集。 DataSet是从丢失的成本且有效的未加工的LWIR热敏摄像机,安装独立和电动车辆中的记录,以最大限度地减少机械振动。最先进的YOLO-V5网络变体使用四个不同的公共数据集进行培训,也可以通过采用SGD优化器来实现DNN的最佳通用的本地数据集。培训网络的有效性在广泛的测试数据上使用了各种定量度量来验证,包括精度,召回曲线,平均精度和每秒帧。使用规特相关推理加速器进一步优化YOLO的较小网络变体,明确提高每秒速率的帧。在低功率边缘设备上测试时,优化的网络引擎在低功耗边缘设备上测试时,每秒速率增加3.5倍。在NVIDIA Jetson Nano和60 fps上的NVIDIA Xavier NX Development Landls上实现了11个FPS。
translated by 谷歌翻译