最近已结合了进化算法(EAS)和深度加强学习(DRL)以集成两个解决方案的优势以获得更好的政策学习。然而,在现有的混合方法中,EA用于直接培训策略网络,这将导致对政策绩效的样本效率和不可预测的影响。为了更好地整合这两种方法并避免引入EA引起的缺点,我们致力于设计更有效和合理的结合EA和DRL的方法。在本文中,我们提出了进化行动选择 - 双胞胎延迟深度确定性政策梯度(EAS-TD3),是EA和DRL的新组合。在EAS中,我们专注于优化策略网络选择的动作,并尝试通过进化算法来指导策略学习的高质量行动。我们对挑战的连续控制任务进行了几个实验。结果表明,EAS-TD3在其他最先进的方法中显示出优异的性能。
translated by 谷歌翻译
股票运动预测(SMP)旨在预测上市公司的股份量股份,由于金融市场的挥发性,这是一个具有挑战性的任务。最近的财务研究表明,动量溢出效应在股票波动中发挥着重要作用。然而,以前的研究通常只学习相关公司之间的简单连接信息,这不可避免地未能模仿真实金融市场中上市公司的复杂关系。为了解决这个问题,我们首先建立一个更全面的市场知识图(MKG),其中包含有限的公司,包括上市公司及其相关的高管,以及包括明确关系和隐性关系的混合关系。之后,我们提出了一种新颖的双重关注网络,以了解基于构造的MKG用于库存预测的势头溢出信号。对九个SOTA基线构建数据集的实证实验表明,所提出的丹林公司能够改善与构造的MKG的库存预测。
translated by 谷歌翻译
风险评分广泛用于临床决策,通常由逻辑回归模型产生。基于机器学习的方法可以很好地识别重要的预测因子,但这种“黑匣子”变量选择限制解释性,并且从单个模型评估的可变重要性可以偏置。我们提出了一种强大而可解释的可解释的可解释选择方法,使用最近开发的福利可变重要性云(福利维奇)占模型的可变性。我们的方法评估和可视化了深入推理和透明变量选择的总变量贡献,并过滤出非重要贡献者来简化模型构建步骤。我们从可变贡献中获得了一个集合变量排名,这很容易与自动化和模块化的风险分数发生器,自动摩托,以方便的实现。在对早期死亡或意外再入住的研究中,福糖选定了6个候选变量中的6个,以创建一个良好的性能,从机器学习的排名到一个16变量模型具有类似的性能。
translated by 谷歌翻译
通过潜在的财政收益,公司可能会聘请Freaudster团体来编写虚假审查,以贬低竞争对手或促进自己的企业。这些群体在误导客户方面更加成功,因为人们更有可能受到一个大型群体意见的影响。为了检测这些组,一个共同的模型是代表欺诈者组的静态网络,从而忽略了评论者的纵向行为,从而忽略了一个组中审阅者之间的共同审查关系的动态。因此,这些方法无法排除异常值审核人员,这些方法是故意伪装在一群群体中的欺诈者,并且真正的审稿人碰巧在欺诈者群体中共同审查。为了解决这个问题,在这项工作中,我们建议首先利用宾馆在审稿人的代表学习中的欣朗的有效性,同时捕获审稿人之间的合作,我们首先利用欣朗来模拟共同审查关系在28天的固定时间窗口中的审核人员。我们将此称为空间关系学习表示,以表示这项工作的恒定性到其他网络方案。然后我们在空间关系上使用RNN,以预测本集团中审核人员的时空关系。在第三步中,图形卷积网络(GCN)使用这些预测的关系改进了审阅者的矢量表示。然后使用这些精制的表示来删除异常值审核员。然后将剩余审阅者表示的平均值馈送到简单的完全连接的层以预测该组是欺诈者组。拟议方法的详尽实验表明,在yelp上的精度,召回和f1值的三种最近的三种方法中,12%(5%),12%(5%)改善(亚马逊)数据集分别。
translated by 谷歌翻译
脾脏是钝性腹腔创伤中最常见的固体器官之一。来自多相CT的自动分割系统的开发用于脾血管损伤的脾血管损伤,可以增强严重程度,以改善临床决策支持和结果预测。然而,由于以下原因,脾血管损伤的准确细分是具有挑战性的:1)脾血管损伤可以是高度变体的形状,质地,尺寸和整体外观; 2)数据采集是一种复杂和昂贵的程序,需要来自数据科学家和放射科学家的密集努力,这使得大规模的注释数据集难以获取。鉴于这些挑战,我们在此设计了一种用于多相脾血管损伤分割的新框架,尤其是数据有限。一方面,我们建议利用外部数据作为矿井伪脾面罩作为空间关注,被称为外部关注,用于引导脾血管损伤的分割。另一方面,我们开发一个合成相位增强模块,它在生成的对抗网络上构建,通过完全利用不同阶段之间的关系来填充内部数据。通过联合实施外部注意力和填充内部数据表示,我们提出的方法优于其他竞争方法,并且在平均DSC方面大大改善了超过7%的流行Deeplab-V3 +基线,这证实了其有效性。
translated by 谷歌翻译
图形神经网络(GNNS)在建模图形结构数据方面表明了它们的能力。但是,实际图形通常包含结构噪声并具有有限的标记节点。当在这些图表中培训时,GNN的性能会显着下降,这阻碍了许多应用程序的GNN。因此,与有限标记的节点开发抗噪声GNN是重要的。但是,这是一个相当有限的工作。因此,我们研究了在具有有限标记节点的嘈杂图中开发鲁棒GNN的新问题。我们的分析表明,嘈杂的边缘和有限的标记节点都可能损害GNN的消息传递机制。为减轻这些问题,我们提出了一种新颖的框架,该框架采用嘈杂的边缘作为监督,以学习去噪和密集的图形,这可以减轻或消除嘈杂的边缘,并促进GNN的消息传递,以缓解有限标记节点的问题。生成的边缘还用于规则地将具有标记平滑度的未标记节点的预测规范化,以更好地列车GNN。实验结果对现实世界数据集展示了在具有有限标记节点的嘈杂图中提出框架的稳健性。
translated by 谷歌翻译
Gaits和Transitions是腿部运动的关键组件。对于腿机器人,描述和再现Gaits以及过渡仍然存在长期挑战。强化学习已成为制定腿机器人控制器的强大工具。然而,学习多次Gaits和Transitions,与多任务学习问题有关。在这项工作中,我们提出了一种新颖的框架,用于培训一个简单的控制策略,以便将四足机器人培训到各种GA足够的机器人。使用四个独立阶段作为步态发生器和控制策略之间的界面,其表征了四英尺的运动。由阶段引导,四叉机器人能够根据生成的遗传率,例如步行,小跑,起搏和边界,并在那些Gaits之间进行过渡。可以使用更多的一般阶段来产生复杂的Gaits,例如混合节奏跳舞。通过控制策略,黑豹机器人是一种中型狗大小的四足机器人,可以在自然环境中平滑且鲁棒地在速度和鲁棒方面进行速度下进行所有学习的电机技能。
translated by 谷歌翻译
统计物理学的最新进展显示了机器学习在识别阶段过渡时的显着性能。在本文中,我们基于转移学习施加域对抗性神经网络(DANN),以研究非平衡和平衡相变模型,分别是渗透模型和定向渗透(DP)模型。通过DANN,只需要标记一小部分输入配置(2D图像),以便自动选择,以便捕获临界点。要了解DP模型,该方法通过确定临界点的迭代过程来改进,这是计算临界指数$ \ nu _ {\ perp} $的数据崩溃的先决条件。然后,我们将DANN应用于二维站点的遗传筛选,该配置过滤以仅包括可能包含与订单参数相关的信息的最大群集。两种模型的DANN学习都会产生可靠的结果,它与来自蒙特卡罗模拟的结果相当。我们的研究还表明,与监督学习相比,Dann可以以更低的成本实现相当高的准确性。
translated by 谷歌翻译
在过去的十年中,许多深入学习模型都受到了良好的培训,并在各种机器智能领域取得了巨大成功,特别是对于计算机视觉和自然语言处理。为了更好地利用这些训练有素的模型在域内或跨域转移学习情况下,提出了知识蒸馏(KD)和域适应(DA)并成为研究亮点。他们旨在通过原始培训数据从训练有素的模型转移有用的信息。但是,由于隐私,版权或机密性,原始数据并不总是可用的。最近,无数据知识转移范式吸引了吸引人的关注,因为它涉及从训练有素的模型中蒸馏宝贵的知识,而无需访问培训数据。特别是,它主要包括无数据知识蒸馏(DFKD)和源无数据域适应(SFDA)。一方面,DFKD旨在将域名域内知识从一个麻烦的教师网络转移到一个紧凑的学生网络,以进行模型压缩和有效推论。另一方面,SFDA的目标是重用存储在训练有素的源模型中的跨域知识并将其调整为目标域。在本文中,我们对知识蒸馏和无监督域适应的视角提供了全面的数据知识转移,以帮助读者更好地了解目前的研究状况和想法。分别简要审查了这两个领域的应用和挑战。此外,我们对未来研究的主题提供了一些见解。
translated by 谷歌翻译
低频词预测仍然是现代神经电机翻译(NMT)系统的挑战。最近的自适应培训方法通过强调整体培训目标的重量来促进不频繁词语的产出。尽管召回了低频词的召回,但它们的预测精度意外地受到自适应目标的阻碍。灵感来自观察到低频词形成更紧凑的嵌入空间,我们从代表学习角度解决这一挑战。具体地,我们提出了一种频率感知的令牌级对比度学习方法,其中每个解码步骤的隐藏状态以基于相应的字频率的柔和对比方式从其他目标单词的对应物推开。我们对广泛使用的NIST汉语 - 英语和WMT14英语 - 德语翻译任务进行实验。经验结果表明,我们的提出方法不仅可以显着提高翻译质量,还可以提高词汇分集和优化词表示空间。进一步调查揭示了,与相关的自适应培训策略相比,我们对低频词预测方法的优势在于在不牺牲精度的情况下在不同频率上的令牌级召回的鲁棒性。
translated by 谷歌翻译