智能论文笔记

Estimators of Entropy and Information via Inference in Probabilistic Models

Feras A. Saad , Marco Cusumano-Towner , Vikash K. Mansinghka

分类： (统计)机器学习 | 机器学习

2022-02-24

估计信息理论数量（例如熵和相互信息）对于统计和机器学习中的许多问题至关重要，但在高维度上具有挑战性。本文通过推理（EEVI）介绍了熵的估计器，该推理在概率生成模型中为任意变量提供了许多信息数量的上限和下限。这些估计器将重要性抽样用于提议分布家族，其中包括摊销变异推理和顺序的蒙特卡洛，可以针对目标模型量身定制，并用于以高精度挤压真实的信息值。我们介绍了EEVI的几种理论特性，并在医疗领域的两个问题上证明了可伸缩性和功效：（i）在诊断肝脏疾病的专家系统中，我们根据它们对潜伏性疾病的信息进行排名观察到的症状和患者属性；（ii）在碳水化合物代谢的微分方程模型中，我们找到了最佳时间进行血糖测量，鉴于他们的饮食和药物计划，可以最大程度地提高有关糖尿病患者胰岛素敏感性的信息。

translated by 谷歌翻译

Needle in a Haystack: An Analysis of Finding Qualified Workers on MTurk for Summarization

Lining Zhang , João Sedoc , Simon Mille , Yufang Hou , Sebastian Gehrmann , Daniel Deutsch , Elizabeth Clark , Yixin Liu , Miruna Clinciu , Saad Mahamood

分类：自然语言处理

2022-12-20

The acquisition of high-quality human annotations through crowdsourcing platforms like Amazon Mechanical Turk (MTurk) is more challenging than expected. The annotation quality might be affected by various aspects like annotation instructions, Human Intelligence Task (HIT) design, and wages paid to annotators, etc. To avoid potentially low-quality annotations which could mislead the evaluation of automatic summarization system outputs, we investigate the recruitment of high-quality MTurk workers via a three-step qualification pipeline. We show that we can successfully filter out bad workers before they carry out the evaluations and obtain high-quality annotations while optimizing the use of resources. This paper can serve as basis for the recruitment of qualified annotators in other challenging annotation tasks.

translated by 谷歌翻译

Faster Attention Is What You Need: A Fast Self-Attention Neural Network Backbone Architecture for the Edge via Double-Condensing Attention Condensers

Alexander Wong , Mohammad Javad Shafiee , Saad Abbasi , Saeejith Nair , Mahmoud Famouri

分类：计算机视觉

2022-08-15

随着越来越多的深度学习对在设备上的Tinyml应用程序的采用，人们对对边缘进行优化的更有效的神经网络骨架的需求不断增加。最近，注意力冷凝器网络的引入导致低英寸，高效，自我发挥的神经网络，在准确性和速度之间取得了强大的平衡。在这项研究中，我们介绍了一种新的更快的注意力冷凝器设计，称为双感应注意力冷凝器，以实现更多的冷凝特征嵌入。我们进一步采用了机器驱动的设计探索策略，该策略施加了最佳实践设计限制，以提高效率和稳健性，以产生骨干的宏观构造结构。与其他几个其他最先进的有效骨架相比，所得的主链（我们命名为“参加”）在嵌入式ARM处理器上的推理吞吐量明显更高（以较高的精度和速度比FB-NET C快> 10倍）小型型号尺寸（以较高的速度和类似的精度小于OFA-62小1.47倍），并且准确性（以更高速度的ImageNet上的MobileVit Xs高1.1％）。这些有希望的结果表明，探索不同的有效体系结构设计和自我注意力的机制可以为Tinyml应用带来有趣的新构建块。

translated by 谷歌翻译

Automatically Creating a Large Number of New Bilingual Dictionaries

Khang Nhut Lam , Feras Al Tarouti , Jugal Kalita

分类：自然语言处理

2022-08-12

本文提出的方法是通过单个输入双语词典自动为低资源语言（尤其是资源贫乏的语言）创建大量新的双语词典。我们的算法使用可用的WordNets和Machine Translator（MT）生成了源语言的单词翻译为丰富的目标语言。由于我们的方法仅依赖于一个输入字典，可用的WordNet和MT，因此它们适用于任何双语词典，只要两种语言之一是英语，或者具有链接到Princeton WordNet的WordNet。从5个可用的双语词典开始，我们创建了48个新的双语词典。其中，流行的MTS不支持30双语言：Google和Bing。

translated by 谷歌翻译

Phrase translation using a bilingual dictionary and n-gram data: A case study from Vietnamese to English

Khang Nhut Lam , Feras Al Tarouti , Jugal Kalita

分类：自然语言处理

2022-08-05

使用基于词典的方法将语言L1中的短语转换为语言L2的过去方法需要语法规则来重组初始翻译。本文引入了一种新颖的方法，而无需使用任何语法规则将L1中不存在的L1中的给定短语转换为L2。我们在L2中至少需要一个L1-L2双语词典和N-Gram数据。我们翻译的平均手动评估得分为4.29/5.00，这意味着非常高质量。

translated by 谷歌翻译

CIRDataset: A large-scale Dataset for Clinically-Interpretable lung nodule Radiomics and malignancy prediction

Wookjin Choi , Navdeep Dahiya , Saad Nadeem

分类：计算机视觉

2022-06-29

在肺结节表面上的尖锐/肺泡是肺癌恶性肿瘤的良好预测指标，因此是放射科医生的良好预测指标，作为标准化的肺-RADS临床评分标准的一部分。鉴于放射科医生的结节和2D切片评估的3D几何形状，手动调节/肺泡注释是一项繁琐的任务，因此，迄今为止，尚无公共数据集以探测这些临床报告在SOTA恶性预测中的重要性算法。作为本文的一部分，我们释放了一个大规模临床解释的放射线数据集，即Cirdataset，其中包含来自两个公共数据集的分段肺结节的956个放射学家QA/QC'QA/QC'spiculation/lobulation注释，Lidc-Idri（N = 883）（n = 883）（n = 883）（n = 883） lungx（n = 73）。我们还提出了一个基于多级Voxel2mesh扩展到节段结节的端到端深度学习模型（同时保留尖峰），对尖峰进行分类（尖锐/尖峰和弯曲/叶状/叶状）并执行恶性预测。先前的方法已经对LIDC和LUNGX数据集进行了恶性预测，但没有对任何临床报道/可操作的特征（由于已知的超参数敏感性问题，具有一般归因方案）。随着这种全面宣布的Cirdataset和端到端深度学习基线的发布，我们希望恶性预测方法可以验证其解释，对我们的基线进行基准测试，并提供临床上的见解。数据集，代码，预处理模型和Docker容器可在https://github.com/nadeemlab/cir上找到。

translated by 谷歌翻译

GEMv2: Multilingual NLG Benchmarking in a Single Line of Code

Sebastian Gehrmann , Abhik Bhattacharjee , Abinaya Mahendiran , Alex Wang , Alexandros Papangelis , Aman Madaan , Angelina McMillan-Major , Anna Shvets , Ashish Upadhyay , Bingsheng Yao

分类：自然语言处理 | 人工智能 | 机器学习

2022-06-22

通常通过过去的选择来告知机器学习中的评估，例如要使用哪些数据集或指标。该标准化可以使用排行榜对平等基础进行比较，但是随着出现更好的替代方案，评估选择变得不佳。这个问题在自然语言生成中尤其相关，该语言需要不断改善的数据集，指标和人类评估以提出确定性的主张。为了使遵循最佳模型评估实践更加容易，我们介绍了GEMV2。新版本的一代，评估和指标基准为数据集，模型和指标开发人员提供了模块化基础架构，以使彼此受益。GEMV2支持40种记录的数据集中51种语言。所有数据集的模型都可以在线评估，我们的交互式数据卡创建和渲染工具使得在Living Benchmark中添加新数据集变得更加容易。

translated by 谷歌翻译

BIO-CXRNET: A Robust Multimodal Stacking Machine Learning Technique for Mortality Risk Prediction of COVID-19 Patients using Chest X-Ray Images and Clinical Data

Tawsifur Rahman , Muhammad E. H. Chowdhury , Amith Khandakar , Zaid Bin Mahbub , Md Sakib Abrar Hossain , Abraham Alhatou , Eynas Abdalla , Sreekumar Muthiyal , Khandaker Farzana Islam , Saad Bin Abul Kashem

分类：计算机视觉 | 机器学习

2022-06-15

快速准确地检测该疾病可以大大帮助减少任何国家医疗机构对任何大流行期间死亡率降低死亡率的压力。这项工作的目的是使用新型的机器学习框架创建多模式系统，该框架同时使用胸部X射线（CXR）图像和临床数据来预测COVID-19患者的严重程度。此外，该研究还提出了一种基于nom图的评分技术，用于预测高危患者死亡的可能性。这项研究使用了25种生物标志物和CXR图像，以预测意大利第一波Covid-19（3月至6月2020年3月至6月）在930名Covid-19患者中的风险。提出的多模式堆叠技术分别产生了89.03％，90.44％和89.03％的精度，灵敏度和F1分数，以识别低风险或高危患者。与CXR图像或临床数据相比，这种多模式方法可提高准确性6％。最后，使用多元逻辑回归的列线图评分系统 - 用于对第一阶段确定的高风险患者的死亡风险进行分层。使用随机森林特征选择模型将乳酸脱氢酶（LDH），O2百分比，白细胞（WBC）计数，年龄和C反应蛋白（CRP）鉴定为有用的预测指标。开发了五个预测因素参数和基于CXR图像的列函数评分，以量化死亡的概率并将其分为两个风险组：分别存活（<50％）和死亡（> = 50％）。多模式技术能够预测F1评分为92.88％的高危患者的死亡概率。开发和验证队列曲线下的面积分别为0.981和0.939。

translated by 谷歌翻译

A Survey on Training Challenges in Generative Adversarial Networks for Biomedical Image Analysis

Muhammad Muneeb Saad , Ruairi O'Reilly , Mubashir Husain Rehmani

分类：机器学习 | 计算机视觉

2022-01-19

In biomedical image analysis, the applicability of deep learning methods is directly impacted by the quantity of image data available. This is due to deep learning models requiring large image datasets to provide high-level performance. Generative Adversarial Networks (GANs) have been widely utilized to address data limitations through the generation of synthetic biomedical images. GANs consist of two models. The generator, a model that learns how to produce synthetic images based on the feedback it receives. The discriminator, a model that classifies an image as synthetic or real and provides feedback to the generator. Throughout the training process, a GAN can experience several technical challenges that impede the generation of suitable synthetic imagery. First, the mode collapse problem whereby the generator either produces an identical image or produces a uniform image from distinct input features. Second, the non-convergence problem whereby the gradient descent optimizer fails to reach a Nash equilibrium. Thirdly, the vanishing gradient problem whereby unstable training behavior occurs due to the discriminator achieving optimal classification performance resulting in no meaningful feedback being provided to the generator. These problems result in the production of synthetic imagery that is blurry, unrealistic, and less diverse. To date, there has been no survey article outlining the impact of these technical challenges in the context of the biomedical imagery domain. This work presents a review and taxonomy based on solutions to the training problems of GANs in the biomedical imaging domain. This survey highlights important challenges and outlines future research directions about the training of GANs in the domain of biomedical imagery.

translated by 谷歌翻译

Jamming Pattern Recognition over Multi-Channel Networks: A Deep Learning Approach

Ali Pourranjbar , Georges Kaddoum , Walid Saad

分类：机器学习

2021-12-19

随着智能干扰的出现，干扰攻击已成为无线系统性能的更严重威胁。智能化器能够更改其策略，以最大限度地减少由合法节点进行跟踪的概率。因此，需要一种能够持续调节对干扰策略的抗干扰机构来打击这种干扰物。值得注意的是，现有的抗干扰方法在这里不适用，因为它们主要关注减轻与不变的干扰政策的干扰攻击，并且很少考虑一个智能的干扰器作为对手。因此，在本文中，提出了与抗干扰技术一起工作的干扰型识别技术。所提出的识别方法采用经常性的神经网络，将Jammer的占用通道作为输入，输出干扰类型。在此方案下，首先确定实时干扰策略，然后选择最合适的对策。因此，可以通过所提出的识别技术来立即检测对干扰策略的任何改变，允许快速切换到适合新的干扰策略的新的抗干扰方法。为了评估所提出的识别方法的性能，派生检测的准确性是Jammer策略切换时间的函数。当Jammer策略切换时间为45时，仿真结果显示所有所考虑的用户数字的检测精度大于70％，当Jammer策略切换时间为45时，精度会提高到90％。

translated by 谷歌翻译