智能论文笔记

A novel approach to increase scalability while training machine learning algorithms using Bfloat 16 in credit card fraud detection

Bushra Yousuf , Rejwan Bin Sulaiman , Musarrat Saberin Nipun

分类：机器学习 | 人工智能

2022-06-24

如今，随着数字银行业务已成为常态，信用卡的使用已变得很普遍。随着这一增加，信用卡中的欺诈也对银行和客户都有一个巨大的问题和损失。正常的欺诈检测系统无法检测欺诈，因为欺诈者使用新技术出现欺诈。这创造了使用基于机器学习的软件来检测欺诈的需求。当前，可用的机器学习软件仅着眼于检测欺诈的准确性，但不关注检测的成本或时间因素。这项研究重点是银行信用卡欺诈检测系统的机器学习可伸缩性。我们已经比较了新提出的技术可用的现有机器学习算法和方法。目的是证明，使用较少的位训练机器学习算法将导致更可扩展的系统，这将减少时间，并且实施成本也较低。

translated by 谷歌翻译

Efficiency Comparison of AI classification algorithms for Image Detection and Recognition in Real-time

Musarrat Saberin Nipun , Rejwan Bin Sulaiman , Amer Kareem

分类：计算机视觉 | 人工智能

2022-06-12

面部检测和识别是人工智能系统中最困难，经常使用的任务。这项研究的目的是介绍和比较系统中使用的几种面部检测和识别算法的结果。该系统始于人类的训练图像，然后继续进行测试图像，识别面部，将其与受过训练的面部进行比较，最后使用OPENCV分类器对其进行分类。这项研究将讨论系统中使用的最有效，最成功的策略，这些策略是使用Python，OpenCV和Matplotlib实施的。它也可以用于CCTV的位置，例如公共场所，购物中心和ATM摊位。

translated by 谷歌翻译

Domain Generalization for Prostate Segmentation in Transrectal Ultrasound Images: A Multi-center Study

Sulaiman Vesal , Iani Gayo , Indrani Bhattacharya , Shyam Natarajan , Leonard S. Marks , Dean C Barratt , Richard E. Fan , Yipeng Hu , Geoffrey A. Sonn , Mirabela Rusu

分类：计算机视觉

2022-09-05

前列腺活检和图像引导的治疗程序通常是在与磁共振图像（MRI）的超声指导下进行的。准确的图像融合依赖于超声图像上前列腺的准确分割。然而，超声图像中降低的信噪比和工件（例如，斑点和阴影）限制了自动前列腺分割技术的性能，并将这些方法推广到新的图像域是本质上很难的。在这项研究中，我们通过引入一种新型的2.5D深神经网络来解决这些挑战，用于超声图像上的前列腺分割。我们的方法通过组合有监督的域适应技术和知识蒸馏损失，解决了转移学习和填充方法的局限性（即，在更新模型权重时，在更新模型权重时的性能下降）。知识蒸馏损失允许保留先前学习的知识，并在新数据集上的模型填充后降低性能下降。此外，我们的方法依赖于注意模块，该模块认为模型特征定位信息以提高分割精度。我们对一个机构的764名受试者进行了培训，并仅使用后续机构中的十个受试者对我们的模型进行了审核。我们分析了方法在三个大型数据集上的性能，其中包括来自三个不同机构的2067名受试者。我们的方法达到了平均骰子相似性系数（骰子）为$ 94.0 \ pm0.03 $，而Hausdorff距离（HD95）为2.28 $ mm $，在第一机构的独立受试者中。此外，我们的模型在其他两个机构的研究中都很好地概括了（骰子：$ 91.0 \ pm0.03 $; hd95：3.7 $ mm $ and Dice：$ 82.0 \ pm0.03 $; hd95 $; hd95：7.1 $ mm $）。

translated by 谷歌翻译

ConFUDA: Contrastive Fewshot Unsupervised Domain Adaptation for Medical Image Segmentation

Mingxuan Gu , Sulaiman Vesal , Mareike Thies , Zhaoya Pan , Fabian Wagner , Mirabela Rusu , Andreas Maier , Ronak Kosti

分类：计算机视觉 | 机器学习

2022-06-08

无监督的域适应性（UDA）旨在将所学的知识从标记的源域转移到未标记的目标域。在UDA的背景下，对比度学习（CL）可以帮助更好地在特征空间中分开类。然而，在图像分割中，由于像素对比度损失的计算，较大的记忆足迹使其使用过度。此外，在医学成像中不容易获得标记的目标数据，并且获得新样品并不经济。结果，在这项工作中，当只有几个（几个）或单个（OneShot）图像可从目标域中获得时，我们将解决更具挑战性的UDA任务。我们应用样式转移模块来减轻目标样本的稀缺性。然后，为了使源和目标特征保持一致并解决传统对比损失的记忆问题，我们提出了基于质心的对比度学习（CCL）和质心规范规则器（CNR），以在方向和幅度上优化对比度对。此外，我们提出了多区域质心学习（MPCCL），以进一步降低目标特征的差异。对MS-CMRSEG数据集的几乎没有Shot评估表明，与基线相比，Cunduda在目标域上的分割性能提高了0.34的骰子分数，并且在更严格的Oneshot设置中提高了0.31骰子分数。

translated by 谷歌翻译

Fair Classification via Transformer Neural Networks: Case Study of an Educational Domain

Modar Sulaiman , Kallol Roy

分类：机器学习 | 人工智能

2022-06-03

如今，教育技术越来越多地使用数据和机器学习（ML）模型。这为学生，讲师和管理员提供了最佳政策的支持和见解。但是，人们众所周知，ML模型受到偏见的影响，这引起了人们对在教育中使用这些自动化的ML算法的公平，偏见和歧视的担忧，以及其意外且不可预见的负面后果。决策过程中偏见的贡献来自用于培训ML模型和模型体系结构的数据集。本文介绍了两个表格数据集上变压器神经网络公平性的初步调查：法学院和学生会学。与经典ML模型相反，基于变压器的模型在求解分类任务时将这些表格数据集转换为更丰富的表示。我们使用不同的公平指标来评估并检查表格数据集中基于变压器模型的公平性和准确性之间的权衡。从经验上讲，我们的方法在法学院数据集中的公平与绩效之间的权衡显示了令人印象深刻的结果。

translated by 谷歌翻译

Learn2Reg: comprehensive multi-task medical image registration challenge, dataset and evaluation in the era of deep learning

Alessa Hering , Lasse Hansen , Tony C. W. Mok , Albert C. S. Chung , Hanna Siebert , Stephanie Häger , Annkristin Lange , Sven Kuckertz , Stefan Heldmann , Wei Shao

分类：计算机视觉

2021-12-08

迄今为止，迄今为止，众所周知，对广泛的互补临床相关任务进行了全面比较了医学图像登记方法。这限制了采用研究进展，以防止竞争方法的公平基准。在过去五年内已经探讨了许多新的学习方法，但优化，建筑或度量战略的问题非常适合仍然是开放的。 Learn2reg涵盖了广泛的解剖学：脑，腹部和胸部，方式：超声波，CT，MRI，群体：患者内部和患者内部和监督水平。我们为3D注册的培训和验证建立了较低的入境障碍，这帮助我们从20多个独特的团队中汇编了65多个单独的方法提交的结果。我们的互补度量集，包括稳健性，准确性，合理性和速度，使得能够独特地位了解当前的医学图像登记现状。进一步分析监督问题的转移性，偏见和重要性，主要是基于深度学习的方法的优越性，并将新的研究方向开放到利用GPU加速的常规优化的混合方法。

translated by 谷歌翻译

Pretrained Language Models are Symbolic Mathematics Solvers too!

Kimia Noorbakhsh , Modar Sulaiman , Mahdi Sharifi , Kallol Roy , Pooyan Jamshidi

分类： (统计)机器学习 | 自然语言处理 | 机器学习

2021-10-07

解决符号数学一直是在人类聪明才智的舞台中，需要组成和复发。然而，最近的研究表明，诸如变压器的大规模语言模型是普遍的，并且可以令人生意的是，可以训练作为求解复杂数学方程的顺序序列任务。这些大型变压器模型需要有时的培训数据，以概括到看不见的象征性数学问题。在本文中，我们通过使用语言翻译的首先预先预留变压器模型来解决符号任务的示例有效的方法，然后进行微调预先调整佩带的变压器模型来解决符号数学的下游任务。我们通过预磨模的模型实现了与预磨模的集成任务的可比准确性，同时使用大约1.5美元的数量级培训样本，了解符号数学的最先进的深度学习。与集成相比，差分方程任务的测试精度相比，与语言翻译中不存在的更高订单递归相比，相比之下。我们用不同的语言翻译预防我们的模型。我们的结果显示在解决符号数学任务中的语言偏见。最后，我们研究了微调模型对符号数学任务对分发班次的鲁棒性，我们的方法在函数集成的分布换档方案中概得更好。

translated by 谷歌翻译

On the Evolution of Word Order

Idan Rejwan , Avi Caciularu

分类：自然语言处理

2021-01-23

大多数自然语言具有主要或固定的单词秩序。例如，英文中的单词顺序通常是主题动词对象。这项工作试图解释这种现象以及与功能视角的单词秩序的其他类型学发现。特别是，我们检查固定字订单是否提供功能优势，解释这些语言普遍的原因。为此，我们考虑一种语言的进化模型，在理论上和使用遗传算法中的演示，具有固定字阶的语言是最佳的。我们还表明，根据类型的发现，向句子添加信息，例如案例标记和名词 - 动词区别，减少了对固定字令的需求。

translated by 谷歌翻译

MGTAB: A Multi-Relational Graph-Based Twitter Account Detection Benchmark

Shuhao Shi , Kai Qiao , Jian Chen , Shuai Yang , Jie Yang , Baojie Song , Linyuan Wang , Bin Yan

分类：计算机视觉

2023-01-03

The development of social media user stance detection and bot detection methods rely heavily on large-scale and high-quality benchmarks. However, in addition to low annotation quality, existing benchmarks generally have incomplete user relationships, suppressing graph-based account detection research. To address these issues, we propose a Multi-Relational Graph-Based Twitter Account Detection Benchmark (MGTAB), the first standardized graph-based benchmark for account detection. To our knowledge, MGTAB was built based on the largest original data in the field, with over 1.55 million users and 130 million tweets. MGTAB contains 10,199 expert-annotated users and 7 types of relationships, ensuring high-quality annotation and diversified relations. In MGTAB, we extracted the 20 user property features with the greatest information gain and user tweet features as the user features. In addition, we performed a thorough evaluation of MGTAB and other public datasets. Our experiments found that graph-based approaches are generally more effective than feature-based approaches and perform better when introducing multiple relations. By analyzing experiment results, we identify effective approaches for account detection and provide potential future research directions in this field. Our benchmark and standardized evaluation procedures are freely available at: https://github.com/GraphDetec/MGTAB.

translated by 谷歌翻译

Ontology-based Context Aware Recommender System Application for Tourism

Vitor T. Camacho , José Cruz

分类：机器学习

2022-12-29

In this work a novel recommender system (RS) for Tourism is presented. The RS is context aware as is now the rule in the state-of-the-art for recommender systems and works on top of a tourism ontology which is used to group the different items being offered. The presented RS mixes different types of recommenders creating an ensemble which changes on the basis of the RS's maturity. Starting from simple content-based recommendations and iteratively adding popularity, demographic and collaborative filtering methods as rating density and user cardinality increases. The result is a RS that mutates during its lifetime and uses a tourism ontology and natural language processing (NLP) to correctly bin the items to specific item categories and meta categories in the ontology. This item classification facilitates the association between user preferences and items, as well as allowing to better classify and group the items being offered, which in turn is particularly useful for context-aware filtering.

translated by 谷歌翻译