由于新型模型利用较大的数据集和新颖架构,通过生成模型创建的合成图像提高了质量和表现力。尽管这种质感主义是来自创意的角度的正副作用,但是当这种生成模型用于无同意时的冒充时,它会出现问题。这些方法中的大多数是基于源和目标对之间的部分传输,或者它们基于理想的分布生成完全新的样本,仍然类似于数据集中最接近的真实样本。我们提出Mixsyn(阅读为“Mixin”),用于从多种来源学习新的模糊组合物并将新颖的图像作为与组合物对应的图像区域的混合。 Mixsyn不仅将来自多个源掩码的不相关的区域与相干语义组成相结合,而且还生成了非现有图像的掩模感知的高质量重建。我们将Mixsyn与最先进的单源顺序发电和拼贴生成方法相比,在质量,多样性,现实主义和表现力方面;同时还展示了交互式合成,混合和匹配,以及编辑传播任务,没有掩码依赖性。
translated by 谷歌翻译
通常,基于生物谱系的控制系统可能不依赖于各个预期行为或合作适当运行。相反,这种系统应该了解未经授权的访问尝试的恶意程序。文献中提供的一些作品建议通过步态识别方法来解决问题。这些方法旨在通过内在的可察觉功能来识别人类,尽管穿着衣服或配件。虽然该问题表示相对长时间的挑战,但是为处理问题的大多数技术存在与特征提取和低分类率相关的几个缺点,以及其他问题。然而,最近的深度学习方法是一种强大的一组工具,可以处理几乎任何图像和计算机视觉相关问题,为步态识别提供最重要的结果。因此,这项工作提供了通过步态认可的关于生物识别检测的最近作品的调查汇编,重点是深入学习方法,强调他们的益处,暴露出弱点。此外,它还呈现用于解决相关约束的数据集,方法和体系结构的分类和表征描述。
translated by 谷歌翻译
心肌活力的评估对于患有心肌梗塞的患者的诊断和治疗管理是必不可少的,并且心肌病理学的分类是本评估的关键。这项工作定义了医学图像分析的新任务,即进行心肌病理分割(MYOPS)结合三个序列的心脏磁共振(CMR)图像,该图像首次与Mycai 2020一起在Myops挑战中提出的。挑战提供了45个配对和预对准的CMR图像,允许算法将互补信息与三个CMR序列组合到病理分割。在本文中,我们提供了挑战的详细信息,从十五个参与者的作品调查,并根据五个方面解释他们的方法,即预处理,数据增强,学习策略,模型架构和后处理。此外,我们对不同因素的结果分析了结果,以检查关键障碍和探索解决方案的潜力,以及为未来的研究提供基准。我们得出结论,虽然报告了有前途的结果,但研究仍处于早期阶段,在成功应用于诊所之前需要更深入的探索。请注意,MyOPS数据和评估工具继续通过其主页(www.sdspeople.fudan.edu.cn/zhuangxiahai/0/myops20 /)注册注册。
translated by 谷歌翻译
在本文中,我们介绍了Amharic语音情绪数据集(亚胺),涵盖了四条方言(Gojjam,Wollo,Shewa和Londer)和五种不同的情绪(中性,恐惧,快乐,悲伤和生气)。我们认为它是Amharic语言的第一个语音情感认可(Ser)数据集。 65志愿者参与者,所有母语人员,记录2,474个声音样本,长度为2至4秒。八名法官将情绪分配给具有高协议水平的样本(Fleiss Kappa = 0.8)。生成的数据集可免费下载。接下来,我们开发了一个四层变体,我们称之为vggb。然后使用vggb进行三种实验,用于Ser,使用ASED。首先,我们研究了熔融谱图特征或熔融频率谱系数(MFCC)的特点是Amharic最适合的。这是通过培训ASID的两个VGGB SER模型来完成的,使用MEL-谱图和使用MFCC的另一个。尝试了四种形式的培训,标准交叉验证和三种变体,基于句子,方言和扬声器组。因此,用于训练的句子不会用于测试,以及方言和扬声器组的句子。结论是,在所有四种训练方案下,MFCC功能都是优越的。因此,MFCC采用实验2,其中VGGB和其他三种现有模型进行了验证:Resnet50,Alex-Net和LSTM。 vggb被发现具有非常好的准确性(90.73%)以及最快的培训时间。在实验3中,在培训在两个现有的SER数据集,RAVDES(英语)和EMO-DB(德语)以及ASED(Amharic)上进行培训时比较VGGB的性能。结果与这些语言相当,仿真是最高的。这表明VGGB可以成功应用于其他语言。我们希望Ased将鼓励研究人员试验其他模型为Amharic Ser。
translated by 谷歌翻译
排名和分数是判断使用的两个常见数据类型,以表达对象集合中对质量的偏好和/或质量的看法。存在许多模型以单独研究每种类型的数据,但没有统一的统计模型同时捕获两个数据类型,而不首先执行数据转换。我们提出了Mallows-Binomial模型来缩短这种差距,它通过量化的参数来与二项式分数模型相结合,这些差距通过量化的参数来量化对象质量,共识等级和法官之间的共识水平。我们提出了一种有效的树搜索算法来计算模型参数的精确MLE,分析和通过模拟研究模型的统计特性,并通过模拟将我们的模型应用于来自授予面板审查的实例,从而将其分数和部分排名的拨款。 。此外,我们展示了如何使用模型输出来排序对象的信心。拟议的模型被证明是从分数和排名中明智地结合信息,以量化对象质量并衡量具有适当统计不确定性的相互达成的共识。
translated by 谷歌翻译
估计值函数是增强学习算法的核心组件。时间差异(TD)学习算法使用自引导,即,它们在随后的时间步骤中使用值估计更新朝向学习目标的值函数。或者,可以朝着通过单独预测继承人特征(SF)构成的学习目标来更新值函数 - 依赖于策略的模型 - 并将它们与瞬时奖励相结合。我们专注于在估计值函数时使用的自举目标,并提出新的备份目标,它是\ eta $ -return混合的混合,它隐含地结合了价值预测知识(由TD方法使用)与(继承人)特征预测知识 - 使用参数$ \ eta $捕获每个依赖的多少。我们说明通过$ \ eta \ gamma $ -dicounted sf模型结合了预测知识使得更有效地利用采样体验,而不是完全在价值函数估计上,或者在单独估计的继承功能的乘积上启动。和瞬时奖励模型。我们经验显示这种方法导致更快的政策评估和更好的控制性能,用于表格和非线性函数近似,指示可扩展性和一般性。
translated by 谷歌翻译
研究多层合作研究中的一个关键挑战是不仅需要有效合作的个人代理,而且需要与谁合作。当其他代理人隐藏的情况下,可能是错误的动机和目标时,这在局势中特别关键。社交扣除游戏提供途径来研究个人如何学习如何综合有关其他人的潜在不可靠的信息,并阐明其真正的动机。在这项工作中,我们展示了隐藏的议程,这是一个双队的社交扣除游戏,为在未知团队对齐的情况下学习学习代理的2D环境。环境承认两支球队的丰富战略。在隐藏议程中培训的强化学习代理表明,代理商可以学习各种行为,包括合作和投票,而无需以自然语言沟通。
translated by 谷歌翻译
在本文中,我们提出了一种基于游戏理论方法的分散,隐私友好的能源交易平台(PFET) - 特别是Stackelberg竞争。与现有的交易计划不同,PFET提供了竞争力的市场,其中基于竞争确定的价格和需求,并以分散的方式执行计算,这些方式不依赖于可信第三方。它使用同性恋加密密码系统来加密买家和卖家等敏感信息,如卖家$价格和买家$'$要求。买家使用加密数据计算对特定卖方的总需求,并将敏感的买方配置文件数据隐藏在卖家中。因此,保留了卖家和买家的隐私。通过隐私分析和绩效评估,我们展示了PFET以有效的方式保留了用户$'$隐私。
translated by 谷歌翻译
自闭症谱系障碍(ASD)是一种神经发育障碍,导致发生改变的行为,社会发展和通信模式。在过去几年中,自闭症患病率增加了两倍,现在有1分中有1个现在受到影响。鉴于传统诊断是一种冗长,劳动密集型的过程,已经对自动筛选自闭症的发展系统来说,已经提出了重大关注。韵律异常是自闭症的最明显的迹象,受影响的儿童展示言语特质,包括梯度,单调的语调,非典型音高和不规则语言压力模式。在这项工作中,我们展示了一套机器学习方法,以检测自闭症和神经典型(NT)儿童在家庭环境中捕获的自闭症语音音频中的自闭症。我们考虑了三种方法来检测儿童的自闭症语言:首先,在提取的音频特征(包括熔融频率跳跃系数)上培训的随机森林;二,卷积神经网络(CNNS)培训谱图;第三,微调Wav2Vec 2.0 - 基于最先进的基于变压器的ASR模型。我们在从斯坦福的猜测中培训我们的小说Todaset的小说数据集的分类器?移动游戏,一个应用程序,旨在在自然家庭环境中占有自闭症和神经典型的儿童的视频。随机森林分类器实现了70%的精度,微调Wav2Vec 2.0型号达到了77%的精度,CNN在将儿童的音频视为ASD或NT时,CNN可实现79%的准确性。我们的模型能够在具有不一致的录制质量选择的家庭音频剪辑上培训时预测自闭症状态,这可能更广泛地对现实世界的条件。这些结果表明,机器学习方法提供了在没有专门设备的语音中自动检测自闭症的承诺。
translated by 谷歌翻译
目的:确定逼真,但是电磁图的计算上有效模型可用于预先列车,具有广泛的形态和特定于给定条件的形态和异常 - T波段(TWA)由于创伤后应激障碍,或重点 - 在稀有人的小型数据库上显着提高了性能。方法:使用先前经过验证的人工ECG模型,我们生成了180,000人的人工ECG,有或没有重要的TWA,具有不同的心率,呼吸率,TWA幅度和ECG形态。在70,000名患者中培训的DNN进行分类为25种不同的节奏,将输出层修改为二进制类(TWA或NO-TWA,或等效,PTSD或NO-PTSD),并对人工ECG进行转移学习。在最终转移学习步骤中,DNN在ECG的培训和交叉验证,从12个PTE和24个控件,用于使用三个数据库的所有组合。主要结果:通过进行转移学习步骤,使用预先培训的心律失常DNN,人工数据和真实的PTSD相关的心电图数据,发现了最佳性能的方法(AUROC = 0.77,精度= 0.72,F1-SCATE = 0.64) 。从训练中删除人工数据导致性能的最大下降。从培训中取出心律失常数据提供了适度但重要的,表现下降。最终模型在人工数据上显示出在性能下没有显着下降,表明没有过度拟合。意义:在医疗保健中,通常只有一小部分高质量数据和标签,或更大的数据库,质量较低(和较差的相关)标签。这里呈现的范式,涉及基于模型的性能提升,通过在大型现实人工数据库和部分相关的真实数据库上传输学习来提供解决方案。
translated by 谷歌翻译