我们考虑了最大化的影响(IM)问题:'如果我们能说服社交网络中的一部分个人采用新产品或创新,目的是触发大量的进一步收养级联我们应该定位吗?正式地,这是在社交网络中选择$ K $种子节点的任务,以使网络中预期的影响节点(在某些影响下传播模型)最大化。在文献中已经广泛研究了这个问题,并提出了几种解决方案方法。但是,大多数基于模拟的方法涉及耗时的蒙特卡洛模拟,以计算种子节点在整个网络中的影响。这限制了这些方法在大型社交网络上的适用性。在本文中,我们有兴趣以时间效率的方式解决影响最大化的问题。我们提出了一种社区意识的分歧和纠纷策略,涉及(i)学习社交网络的固有社区结构,(ii)通过解决每个社区的影响最大化问题,以及(iii)选择最终的影响力来生成候选解决方案。使用新颖的渐进预算计划来自候选解决方案的个人。我们提供有关现实世界社交网络的实验,表明所提出的算法在经验运行时和启发式算法方面优于基于仿真的算法。我们还研究了社区结构对算法性能的影响。我们的实验表明,具有较高模块化的社区结构导致所提出的算法在运行时和影响方面表现更好。
translated by 谷歌翻译
视频胶囊内窥镜检查是计算机视觉和医学的热门话题。深度学习会对视频胶囊内窥镜技术的未来产生积极影响。它可以提高异常检测率,减少医生的筛查时间并有助于实际临床分析。视频胶囊内窥镜检查的CADX分类系统已显示出进一步改进的巨大希望。例如,检测癌性息肉和出血会导致快速的医疗反应并提高患者的存活率。为此,自动化的CADX系统必须具有较高的吞吐量和不错的精度。在本文中,我们提出了焦距,这是一个与轻量级卷积层集成的焦点调制网络,用于分类小肠解剖学地标和腔内发现。 FocalConvnet利用焦点调制以实现全球环境,并允许在整个正向通行证中进行全局本地空间相互作用。此外,具有固有的感应/学习偏置和提取分层特征的能力的卷积块使我们的焦点concalconvnet能够获得高吞吐量的有利结果。我们将焦点vnet与Kvasir-Capsule上的其他SOTA进行比较,Kvasir-Capsule是一个具有44,228帧的大型VCE数据集,具有13类不同的异常。我们提出的方法分别超过了其他SOTA方法论,加权F1得分,回忆和MCC}分别超过了其他SOTA方法。此外,我们报告了在实时临床环境中建立焦距的148.02图像/秒速率的最高吞吐量。建议的focalConvnet的代码可在https://github.com/noviceman-prog/focalconvnet上获得。
translated by 谷歌翻译
原始收集的培训数据通常带有从多个不完美的注释器中收集的单独的嘈杂标签(例如,通过众包)。通常,首先将单独的嘈杂标签汇总为一个,并应用标准培训方法。文献还广泛研究了有效的聚合方法。本文重新审视了此选择,并旨在为一个问题提供一个答案,即是否应该将单独的嘈杂标签汇总为单个单个标签或单独使用它们作为给定标签。我们从理论上分析了许多流行损失功能的经验风险最小化框架下的两种方法的性能,包括专门为使用嘈杂标签学习的问题而设计的损失功能。我们的定理得出的结论是,当噪声速率较高时,标签分离优于标签聚集,或者标记器/注释的数量不足。广泛的经验结果证明了我们的结论。
translated by 谷歌翻译
通过结肠镜检查检测和去除癌前息肉是预防全球结直肠癌的主要技术。然而,内镜医生的结直肠息肉率差异很大。众所周知,计算机辅助诊断(CAD)系统可以帮助内窥镜检测结肠息肉并最大程度地减少内镜医生之间的变化。在这项研究中,我们介绍了一种新颖的深度学习体系结构,称为{\ textbf {mkdcnet}},以自动息肉分割鲁棒性,以鲁棒性数据分布的重大变化。 MKDCNET只是一个编码器decoder神经网络,它使用预先训练的\ textIt {resnet50}作为编码器和小说\ textit {多个内核扩张卷积(MKDC)}块,可以扩展更多的观点,以了解更多强大的和异性的表示形式。对四个公开息肉数据集和细胞核数据集进行的广泛实验表明,当在从不同分布中对未见息肉数据进行测试时,在对同一数据集进行训练和测试时,所提出的MKDCNET在同一数据集进行训练和测试时,超出了最先进的方法。取得丰富的结果,我们证明了拟议的建筑的鲁棒性。从效率的角度来看,我们的算法可以在RTX 3090 GPU上以每秒($ \ of45 $)帧进行处理。 MKDCNET可能是建造临床结肠镜检查实时系统的强大基准。建议的MKDCNET的代码可在\ url {https://github.com/nikhilroxtomar/mkdcnet}上获得。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
森林是每个国家的重要资产。当它被摧毁时,它可能会对环境产生负面影响,而森林大火是主要原因之一。火灾天气指数被广泛用于测量火灾危险,并用于发出丛林大火警告。它也可以用来预测应急管理资源的需求。传感器网络在数据收集和处理能力方面已越来越受欢迎,用于医疗,环境监测,家庭自动化等行业的各种应用。语义传感器网络可以收集各种气候情况,例如风速,温度和相对湿度。但是,由于处理传感器生成的数据流涉及的各种问题,估计火灾指数构成了挑战。因此,森林火灾检测的重要性日复一日增加。构建了基础语义传感器网络(SSN)本体,以允许开发人员创建用于计算火灾天气指数的规则,并将数据集转换为资源描述框架(RDF)。这项研究描述了制定计算火灾天气指数的规则所涉及的各个步骤。此外,这项工作提供了一个基于Web的映射接口,以帮助用户可视化随着时间的推移,火灾天气指数的变化。在推论规则的帮助下,它使用SSN本体论设计了决策支持系统,并通过SPARQL查询了它。拟议的消防管理系统根据情况采取行动,支持推理和开放世界的一般语义,然后是所有本体论
translated by 谷歌翻译
使用深度学习的图像的手写词识别是一个有希望性能的活跃研究区域。IT实际情况,由于安全原因,可能需要在压缩域中处理手写图像。然而,对于压缩图像的处理仍然非常有限的深度学习的利用。通过在深度学习中的最新进展中,在压缩域中处理文档图像的需要,我们提出了一个HWRCNET模型,用于JPEG压缩域中的手写字识别。所提出的模型结合了基于卷积神经网络(CNN)和双向长短期存储器(BILSTM)的经常性神经网络(RNN)。基本上,我们使用压缩域图像训练模型,并遵守89.05%字识别精度和13.37%的字符错误率非常有吸引力的性能。
translated by 谷歌翻译
扩散概率模型已被证明在几个竞争性图像综合基准上产生最先进的结果,但缺乏低维,可解释的潜在空间,并且在一代中慢慢。另一方面,变形AutoEncoders(VAES)通常可以访问低维潜空间,但表现出差的样品质量。尽管最近的进步,VAE通常需要潜在代码的高维层次结构来产生高质量样本。我们呈现DiffUsevae,一种新的生成框架,它在扩散模型框架内集成了VAE,并利用这一点以设计用于扩散模型的新型条件参数化。我们表明所得模型可以在采样效率方面提高无条件扩散模型,同时还配备了具有低维VAE的扩散模型推断潜码。此外,我们表明所提出的模型可以产生高分辨率样本,并展示与标准基准上的最先进模型相当的合成质量。最后,我们表明所提出的方法可用于可控制的图像合成,并且还展示了图像超分辨率和去噪等下游任务的开箱即用功能。为了重现性,我们的源代码将公开可用于\ url {https://github.com/kpandey008/diffusevae}。
translated by 谷歌翻译
我们介绍了一种使用Nerf式生成模型解决逆问题的新框架。给出了单一的2-D图像和已知相机参数的3-D场景重建问题感兴趣。我们展示了天真地优化潜伏的空间,导致伪影和糟糕的新颖观看渲染。我们将此问题归因于3-D几何形状清晰的音量障碍物,并在新颖视野的渲染中变得可见。我们提出了一种新颖的辐射场正则化方法,以获得更好的3-D表面和改进的新颖观点,给定单一视图观察。我们的方法自然地扩展到一般逆问题,包括若有所述,其中仅部分地观察到单一视图。我们通过实验评估我们的方法,实现视觉改进和性能在广泛的任务中升高了基线。与以前的现有技术相比,我们的方法达到了30-40美元的MSE减免和15-25美元的LPIP损失减少。
translated by 谷歌翻译
血压(BP)是心血管疾病和中风最有影响力的生物标志物之一;因此,需要定期监测以诊断和预防医疗并发症的任何出现。目前携带的携带BP监测的无齿状方法,虽然是非侵入性和不引人注目的,涉及围绕指尖光肌谱(PPG)信号的显式特征工程。为了规避这一点,我们提出了一种端到端的深度学习解决方案,BP-Net,它使用PPG波形来估计通过中间连续动脉BP来估计收缩压BP(SBP),平均压力(MAP)和舒张压BP(DBP) (ABP)波形。根据英国高血压协会(BHS)标准的条款,BP-Net为SBP估计实现了DBP和地图估计和B级的A级。 BP-Net还满足了医疗仪器(AAMI)标准的推进和地图估计,分别实现了5.16mmHg和2.89mmHg的平均误差(MAE),分别用于SBP和DBP。此外,我们通过在Raspberry PI 4设备上部署BP-Net来建立我们的方法的无处不在的潜力,并为我们的模型实现4.25毫秒的推理时间来将PPG波形转换为ABP波形。
translated by 谷歌翻译