智能论文笔记

Reward Maximisation through Discrete Active Inference

Lancelot Da Costa , Noor Sajid , Thomas Parr , Karl Friston , Ryan Smith

分类：人工智能

2020-09-17

主动推断是建模生物学和人造药物的行为的概率框架，该框架源于最小化自由能的原理。近年来，该框架已成功地应用于各种情况下，其目标是最大程度地提高奖励，提供可比性，有时甚至是卓越的性能与替代方法。在本文中，我们通过演示如何以及何时进行主动推理代理执行最佳奖励的动作来阐明奖励最大化和主动推断之间的联系。确切地说，我们展示了主动推理为Bellman方程提供最佳解决方案的条件 - 这种公式是基于模型的增强学习和控制的几种方法。在部分观察到的马尔可夫决策过程中，标准的主动推理方案可以为计划视野1的最佳动作产生最佳动作，但不能超越。相比之下，最近开发的递归活跃推理方案（复杂的推理）可以在任何有限的颞范围内产生最佳作用。我们通过讨论主动推理和强化学习之间更广泛的关系来补充分析。

translated by 谷歌翻译

NusaCrowd: Open Source Initiative for Indonesian NLP Resources

Samuel Cahyawijaya , Holy Lovenia , Alham Fikri Aji , Genta Indra Winata , Bryan Wilie , Rahmad Mahendra , Christian Wibisono , Ade Romadhony , Karissa Vincentio , Fajri Koto

分类：自然语言处理 | 人工智能

2022-12-19

We present NusaCrowd, a collaborative initiative to collect and unite existing resources for Indonesian languages, including opening access to previously non-public resources. Through this initiative, we have has brought together 137 datasets and 117 standardized data loaders. The quality of the datasets has been assessed manually and automatically, and their effectiveness has been demonstrated in multiple experiments. NusaCrowd's data collection enables the creation of the first zero-shot benchmarks for natural language understanding and generation in Indonesian and its local languages. Furthermore, NusaCrowd brings the creation of the first multilingual automatic speech recognition benchmark in Indonesian and its local languages. Our work is intended to help advance natural language processing research in under-represented languages.

translated by 谷歌翻译

A Capsule Network for Hierarchical Multi-Label Image Classification

Khondaker Tasrif Noor , Antonio Robles-Kelly , Brano Kusy

分类：计算机视觉 | 机器学习

2022-09-13

图像分类是计算机视觉中最重要的领域之一。当根据层次结构或分类学排列多级图像分类问题时，层次多标签分类适用于较小的图像分类问题。因此，分层分类模式通常在每个实例上提供多个类预测，从而期望这些模式反映图像类的结构相互关联。在本文中，我们提出了用于分层分类的多标签胶囊网络（ML-CAPSNET）。我们的ML-CAPSNET根据分层类标签树结构预测多个图像类。为此，我们提出了一个损失函数，该函数考虑了网络的多标签预测。结果，我们的ML-CAPSNET的训练方法使用粗到细的范式，同时与标签层次结构中的分类水平保持一致。我们还使用广泛可用的数据集执行实验，并将模型与文献其他地方的替代方案进行比较。在我们的实验中，我们的ML capsnet在这些替代方法方面产生了改善的余地。

translated by 谷歌翻译

Shapley value-based approaches to explain the robustness of classifiers in machine learning

Guilherme Dean Pelegrina , Sajid Siraj

分类：机器学习 | 人工智能

2022-09-09

在机器学习中，使用算法 - 不足的方法是一个新兴领域，用于解释单个特征对预测结果的贡献。尽管重点放在解释预测本身上，但已经做了一些解释这些模型的鲁棒性，即每个功能如何有助于实现这种鲁棒性。在本文中，我们建议使用沙普利值来解释每个特征对模型鲁棒性的贡献，该功能以接收器操作特性（ROC）曲线和ROC曲线（AUC）下的面积来衡量。在一个说明性示例的帮助下，我们证明了解释ROC曲线的拟议思想，并可以看到这些曲线中的不确定性。对于不平衡的数据集，使用Precision-Recall曲线（PRC）被认为更合适，因此我们还演示了如何借助Shapley值解释PRC。

translated by 谷歌翻译

Person Monitoring by Full Body Tracking in Uniform Crowd Environment

Zhibo Zhang , Omar Alremeithi , Maryam Almheiri , Marwa Albeshr , Xiaoxiong Zhang , Sajid Javed , Naoufel Werghi

分类：计算机视觉

2022-09-02

全身追踪器用于监视和安全目的，例如人跟踪机器人。在中东，统一的人群环境是挑战最新跟踪器的常态。尽管过去文献中记录的跟踪器技术有了很大的改进，但这些跟踪器尚未使用捕获这些环境的数据集进行了培训。在这项工作中，我们在统一的人群环境中开发了一个带有一个特定目标的注释数据集。该数据集是在四种不同的情况下生成的，在四种不同的情况下，目标主要是与人群一起移动，有时会与它们阻塞，而其他时候，相机的目标视图在短时间内被人群阻止。注释后，它用于评估和微调最新的跟踪器。我们的结果表明，与初始预训练的跟踪器相比，基于两个定量评估指标的微调跟踪器在评估数据集上的性能更好。

translated by 谷歌翻译

Learning Branched Fusion and Orthogonal Projection for Face-Voice Association

Muhammad Saad Saeed , Shah Nawaz , Muhammad Haris Khan , Sajid Javed , Muhammad Haroon Yousaf , Alessio Del Bue

分类：计算机视觉

2022-08-22

近年来，人们对建立面孔和名人声音之间的关联的兴趣越来越大，从而利用YouTube的视听信息。先前的工作采用公制学习方法来学习适合关联匹配和验证任务的嵌入式空间。尽管显示出一些进展，但由于依赖距离依赖的边缘参数，运行时训练的复杂性差以及对精心制作的负面采矿程序的依赖，这种制剂是限制性的。在这项工作中，我们假设一个丰富的表示形式以及有效但有效的监督对于实现面部voice关联任务的歧视性关节嵌入空间很重要。为此，我们提出了一种轻巧的插件机制，该机制利用这两种方式中的互补线索以通过正交性约束来根据其身份标签形成丰富的融合杂物并将其簇形成。我们将我们提出的机制作为融合和正交投影（FOP）创造，并在两个流网络中实例化。在Voxceleb1和Mav-Celeb数据集上评估了总体结果框架，其中包括许多任务，包括跨模式验证和匹配。结果表明，我们的方法对当前的最新方法有利，而我们提出的监督表述比当代方法所采用的方法更有效。此外，我们还利用跨模式验证和匹配任务来分析多种语言对面部声音协会的影响。代码可用：\ url {https://github.com/msaadsaeed/fop}

translated by 谷歌翻译

A Survey of Recommender System Techniques and the Ecommerce Domain

Imran Hossain , Md Aminul Haque Palash , Anika Tabassum Sejuty , Noor A Tanjim , MD Abdullah AL Nasim , Sarwar Saif , Abu Bokor Suraj

分类：人工智能

2022-08-15

在这个大数据时代，当前一代很难从在线平台中包含的大量数据中找到正确的数据。在这种情况下，需要一个信息过滤系统，可以帮助他们找到所需的信息。近年来，出现了一个称为推荐系统的研究领域。推荐人变得重要，因为他们拥有许多现实生活应用。本文回顾了推荐系统在电子商务，电子商务，电子资源，电子政务，电子学习和电子生活中的不同技术和发展。通过分析有关该主题的最新工作，我们将能够详细概述当前的发展，并确定建议系统中的现有困难。最终结果为从业者和研究人员提供了对建议系统及其应用的必要指导和见解。

translated by 谷歌翻译

Graph CNN for Moving Object Detection in Complex Environments from Unseen Videos

Jhony H. Giraldo , Sajid Javed , Naoufel Werghi , Thierry Bouwmans

分类：计算机视觉

2022-07-13

移动对象检测（MOD）是许多计算机视觉应用程序的基本步骤。当从静态或移动的摄像机捕获的视频序列遇到挑战时，MOD变得非常具有挑战性：伪装，阴影，动态背景和照明变化，仅举几例。深度学习方法已成功地应用于竞争性能。但是，为了解决过度拟合的问题，深度学习方法需要大量标记的数据，这是一项艰巨的任务，因为始终无法提供详尽的注释。此外，某些MOD深度学习方法显示了在看不见的视频序列存在下的性能下降，因为在网络学习过程中涉及相同序列的测试和训练分裂。在这项工作中，我们使用图形卷积神经网络（GCNN）提出了MOD作为节点分类问题的问题。我们的算法被称为GraphMod-NET，包括实例分割，背景初始化，特征提取和图形结构。在看不见的视频上测试了GraphMod-NET，并且在无监督，半监督和监督的学习中，在2014年变更检测（CDNET2014）和UCSD背景减法数据集中的最先进方法进行了测试。

translated by 谷歌翻译

Monkeypox Skin Lesion Detection Using Deep Learning Models: A Feasibility Study

Shams Nafisa Ali , Md. Tazuddin Ahmed , Joydip Paul , Tasnim Jahan , S. M. Sakeef Sani , Nawsabah Noor , Taufiq Hasan

分类：计算机视觉 | 人工智能

2022-07-06

由于其在非洲以外的40多个国家 /地区的迅速传播，最近的蒙基托克斯爆发已成为公共卫生问题。由于与水痘和麻疹的相似之处，蒙基托斯在早期的临床诊断是具有挑战性的。如果不容易获得验证性聚合酶链反应（PCR）测试，那么计算机辅助检测蒙基氧基病变可能对可疑病例的监视和快速鉴定有益。只要有足够的训练示例，深度学习方法在自动检测皮肤病变中有效。但是，截至目前，此类数据集尚未用于猴蛋白酶疾病。在当前的研究中，我们首先开发``Monkeypox皮肤病变数据集（MSLD）。用于增加样本量，并建立了3倍的交叉验证实验。在下一步中，采用了几种预训练的深度学习模型，即VGG-16，Resnet50和InceptionV3用于对Monkeypox和Monkeypox和Monkeypox和其他疾病。还开发了三种型号的合奏。RESNET50达到了82.96美元（\ pm4.57 \％）$的最佳总体准确性，而VGG16和整体系统的准确性达到了81.48美元（\ pm6.87 \％）$和$ 79.26（\ pm1.05 \％）$。还开发了一个原型网络应用程序作为在线蒙基蛋白筛选工具。虽然该有限数据集的初始结果是有希望的，但需要更大的人口统计学多样化的数据集来进一步增强性增强性。这些的普遍性楷模。

translated by 谷歌翻译

Mapping Mid-air Haptics with a Low-cost Tactile Robot

Noor Alakhawand , William Frier , Nathan F. Lepora

分类：机器人

2022-07-04

空中触觉创造了一种新的反馈方式，以使人们能够在空中感觉到触觉。超声波阵列聚焦在空间中的声音辐射压力，以引起由此产生的皮肤偏转的触觉感觉。在这项工作中，我们提出了一个低成本的触觉机器人，以测试空中触觉。通过将桌面机器人组与3D打印的仿生触觉传感器相结合，我们开发了一个可以感知，映射和可视化超声传感器阵列产生的空气触觉感觉的系统。我们通过对各种空气中的触觉刺激进行测试，包括未经调节和调节的焦点来评估触觉机器人。我们将刺激的映射与用于测试空气中触觉的另一种方法的映射：激光多普勒振动法，突出了触觉机器人的优势，包括较低的成本，轻巧的表格因子和易用性。总体而言，这些发现表明我们的方法具有感知空气中触觉的多重好处，并为扩展测试以更好地模仿人触觉感知开辟了新的可能性。

translated by 谷歌翻译