今天的电信网络已成为大量广泛异构数据的来源。该信息可以从网络交通轨迹,网络警报,信号质量指示符,用户行为数据等中检索。需要高级数学工具从这些数据中提取有意义的信息,并从网络生成的数据中做出与网络的正常运行有关的决策。在这些数学工具中,机器学习(ML)被认为是执行网络数据分析和实现自动网络自配置和故障管理的最具前景的方法之一。 ML技术在光通信网络领域的应用受到光网络在最近几年所面临的网络复杂性的前所未有的增长的推动。这种复杂性的增加是由于引入了一系列可调和相互依赖的系统参数(例如,路由配置,调制格式,符号率,编码方案等),这些参数通过使用相干传输/接收技术,高级数字信号处理和光纤传播中非线性效应的补偿。在本文中,我们概述了ML在光通信和网络中的应用。我们对涉及该主题的相关文献进行分类和调查,并且我们还为对该领域感兴趣的研究人员和从业者提供了ML的入门教程。虽然最近出现了大量的研究论文,但ML光学网络的应用仍处于起步阶段:为了激发这一领域的进一步工作,我们总结了该论文提出了新的可能的研究方向。
translated by 谷歌翻译
尽管在不受控制的人脸检测方面取得了巨大进步,但在野外进行准确有效的人脸定位仍然是一个开放的挑战。本文提出了一种强大的单阶段人脸检测器,名为RetinaFace,可在不同尺度的人脸上进行像素方式的人脸定位。利用联合监督和自我监督的多任务学习的优势。具体来说,我们在以下五个方面做出了贡献:(1)我们在WIDER FACE数据集上手动注释五个面部标志,并在这个额外的监督信号的帮助下观察硬面检测的显着改进。 (2)我们进一步添加一个自监督网格解码器分支,用于预测与现有监督分支并行的像素三维形状面部信息。 (3)在WIDER FACE硬测试集上,RetinaFace的性能优于现有技术平均精度(AP)1.1美元\%$(达到AP等于{\ bf $ 91.4 \%$})。 (4)在IJB-C测试集上,RetinaFace使最先进的方法(ArcFace)能够在面部验证中改善其结果(TAR = $ 89.59 \%$,FAR = 1e-6)。 (5)通过采用轻量级骨干网络,RetinaFace可以在单个CPU核上实时运行VGA分辨率图像。将发布额外的注释和代码,以促进未来的研究。
translated by 谷歌翻译
来自磁共振图像(MRI)的脑肿瘤分割是测量肿瘤对治疗的反应的重要任务。但是,自动分割非常具有挑战性。本文提出了一种基于归一化高斯贝叶斯分类和新的三维流体矢量流(FVF)算法的自动脑肿瘤分类方法。在我们的方法中,提出了NormalizedGaussian混合模型(NGMM)并用于模拟健康的braintissues。利用高斯贝叶斯分类器从测试脑MR图像中获取GaussianBayesian脑图(GBBM)。进一步处理GBBM以初始化3D FVF算法,该算法对脑肿瘤进行分割。该算法有两个主要贡献。首先,我们提出一个NGMM来模拟健康的大脑。其次,我们将2D FVF算法扩展到3D空间并将其用于脑肿瘤分割。所提出的方法在公共可用数据集上验证。
translated by 谷歌翻译
在过去的几年里,通过利用DeepConvolutional Neural Networks(DCNNs)的力量,已经做了很多工作来从单个图像重建3D面部结构。在最近的作品中,使用可微分渲染器来学习面部特征与形状和纹理的3D可变形模型的参数之间的关系。纹理特征要么对应于线条纹理空间的组成部分,要么直接通过自生编码器从野外图像中学习。在所有情况下,最先进方法的面部纹理重建的质量仍然不是能够以高保真度建模纹理。在本文中,我们采用了一种截然不同的方法,并利用生成对抗网络(GAN)和DCNN的力量,以便从单个图像重构面部纹理和形状。也就是说,我们利用GAN来训练一个非常强大的面部纹理生成器。然后,我们重新审视原始的3D可变模型(3DMMs)拟合方法,利用非线性优化来找到最佳重建测试图像的最佳潜在参数。在新的视角下。我们通过端到端的可区分框架,通过对预训练的深度身份特征的监督来优化参数。我们在照片级真实感和身份保持三维面部重建方面表现出色,并且首次实现,据我们所知,面部纹理重建具有高频细节。
translated by 谷歌翻译
由于我们现在越来越多地生成和存储数据,因此数据集的复杂性日益增加。这给机器学习带来了许多挑战,这些挑战导致了新方法和范例的提议,以便能够处理现在被称为大数据的东西。在本文中,我们提出了一种聚合不同贝叶斯网络结构的方法,这种方法是从不同的数据集中学习的,作为需要以水平方式划分的挖掘数据集的第一步,即。关于实例,以便进行处理。考虑在处理这种情况时应该考虑的因素。贝叶斯网络的可扩展学习正在慢慢出现,我们的方法构成了不同来源对高斯贝叶斯网络聚集的第一个见解。通过对合成数据的测试,它获得了超越个人学习的成绩。未来的研究将侧重于扩展方法和测试更多样化的数据集。
translated by 谷歌翻译
近年来,自然语言处理(NLP)以及人工智能(AI)和机器学习(ML)等相关领域日益普及。许多在线课程和资源甚至可以在没有该领域的强大背景的情况下提供。学生常常对某个特定主题感到好奇,但不太清楚从哪里开始学习。为了解答“首先应该学习什么”的问题,我们应用基于联合的方法来学习NLP领域中课程概念的先决条件关系。我们介绍了LectureBank,这是一个包含从大学课程中收集的1,352个英文文件的数据集,每个文件根据现有的分类法进行分类,以及208个手动标记的先决条件相关主题,这些主题是公开的。该数据集将用于教育目的,例如讲座准备和组织以及诸如阅读列表生成之类的应用。此外,我们尝试使用基于神经图的网络和非神经分类器来从我们的数据集中学习这些先决条件关系。
translated by 谷歌翻译
我们研究隐私保护机器学习(PPML)前沿方法的问题,将我们的工作重点放在随机森林上。在协作分析中,PPML试图解决数据共享和隐私需求之间的冲突。这在隐私敏感应用中尤其重要,例如来自不同诊所的EHR数据的临床决策支持的学习预测模型,其中每个诊所负责其患者的隐私。我们为集合方法提出了一种新方法:每个实体从其自己的数据中学习模型,然后当客户端询问新私有实例的预测时,来自所有本地训练模型的答案用于计算预测,使得没有提供额外的信息。我们对随机森林实施这种方法,我们通过对真实世界数据集的实验,包括实际的EHR数据,展示了它的高效率和潜在的准确性。
translated by 谷歌翻译
在本文中,我们提出了一种方法,通过对其决策函数进行抽样来学习替代解释模型,从而获得训练黑盒分类器的全局解释。所设想的方法提供了统一的解决方案,以使用更简单的分类器来近似非线性决策边界,同时保持原始分类准确性。我们使用私人住宅抵押默认数据集作为用例来说明此方法的可行性,以确保在预处理期间属性的可分解性。
translated by 谷歌翻译
本文提出了一种合成面部情感的新方法;根据六种基本表达(即愤怒,厌恶,恐惧,快乐,悲伤和惊奇)或维度,就价值而言(即,积极或消极是一种情感)和唤醒(即,情绪激活)。在Valence-Erousal案例中,基于来自4DFAB数据库的600,000帧的VAannotation创建了一个系统;在分类情况下,系统基于从4DFAB中选择构成的表达序列的顶点帧。所提出的系统在其输入处接受:i)基本的面部表情,或者需要合成的一对价 - 觉醒情绪状态描述符,以及ii)将在其上合成相应情感的人的中性2D图像。提出的方法包括以下步骤:首先,基于所提供的desiredemotional状态,从4DFAB数据库生成一组3D面部网格,并用于构建生成新面部效果的混合形状模型。在2D上合成这种影响中性图像,执行3D可变形模型拟合,然后使重建的面变形以生成目标面部表达。最后,新面孔被渲染成原始图像。定性实验研究说明了真实图像的生成,当中性图像从各种众所周知的实验室控制或野生数据库中采样时,包括Aff-Wild,RECOLA ,AffectNet,AFEW,Multi-PIE,AFEW-VA,BU-3DFE,Bosphorus,RAF-DB。此外,进行定量实验,其中使用来自上述每个数据库的生成图像在数据增强框架中训练的深度神经网络提供情感识别;与当前最先进的技术相比,通过所提出的方法可以获得更好的性能。
translated by 谷歌翻译
顺序性质的数据在许多应用领域中以例如文本数据,DNA序列和软件执行痕迹的形式出现。不同的研究学科开发了从这些数据集中学习序列模型的方法:(i)在机器学习领域,诸如(隐藏)马尔可夫模型和递归神经网络等方法已经开发并成功应用于广泛的任务,(ii)在过程中挖掘过程发现技术旨在生成人类可解释的描述模型,以及(iii)在语法参考领域,重点是以形式语法的形式寻找描述性模型。尽管它们有不同的侧重点,但这些字段共享一个公共区域 - 学习一个准确描述基础数据行为的模型。这些序列模型是生成性的,即它们可以预测在给定的未完成序列之后可能发生的元素。到目前为止,这些领域主要是相互隔离开发的,并且存在非比较性。本文提出了一个跨学科的实验评估,比较四个真实序列数据集上的下一元素预测任务的序列建模技术。结果表明,通常在准确性方面没有针对解释性的机器学习技术优于来自旨在产生可解释模型的处理和语法推理领域的技术。
translated by 谷歌翻译