股票运动预测(SMP)旨在预测上市公司的股份量股份,由于金融市场的挥发性,这是一个具有挑战性的任务。最近的财务研究表明,动量溢出效应在股票波动中发挥着重要作用。然而,以前的研究通常只学习相关公司之间的简单连接信息,这不可避免地未能模仿真实金融市场中上市公司的复杂关系。为了解决这个问题,我们首先建立一个更全面的市场知识图(MKG),其中包含有限的公司,包括上市公司及其相关的高管,以及包括明确关系和隐性关系的混合关系。之后,我们提出了一种新颖的双重关注网络,以了解基于构造的MKG用于库存预测的势头溢出信号。对九个SOTA基线构建数据集的实证实验表明,所提出的丹林公司能够改善与构造的MKG的库存预测。
translated by 谷歌翻译
受益于医疗保健数据的数字化和计算能力的发展,机器学习方法越来越多地用于医疗领域。在医疗保健机器学习中已经确定了公平性问题,导致对有限医疗资源的不公平分配或某些群体的健康风险过多。因此,解决公平问题最近引起了医疗保健社区的越来越多的关注。然而,机器学习的机器学习与机器学习中的公平性的交集仍在研究中。在这篇综述中,我们通过暴露公平问题,总结可能的偏见,整理缓解方法并指出挑战以及未来的机会来建立桥梁。
translated by 谷歌翻译
已经探索了监督机器学习模型的算法追索问题的问题,以提供决策支持系统中更容易解释,透明和健壮的结果。未开发的区域是用于异常检测的算法求程,特别是仅具有离散特征值的表格数据。这里的问题是提出一组反事实,通过潜在的异常检测模型被认为是正常的,以便应用程序可以将此信息用于解释目的或推荐对策。我们提出了一种方法 - 在表格数据(CARAT)中保留异常算法的背景,该方法是有效,可扩展性且不可知的,对基础异常检测模型。 Carat使用基于变压器的编码器模型来通过查找可能性低的特征来解释异常。随后使用异常实例中特征的整体上下文来修改突出显示的功能,从而生成语义相干的反事实。广泛的实验有助于证明克拉的功效。
translated by 谷歌翻译
尽管实用的求解器在各种NP完整域中取得了成功,例如SAT和CSP以及使用深度强化学习来解决诸如GO之类的两人游戏,但某些类别的Pspace-Hard计划问题仍然遥不可及。由于硬实例的指数搜索空间,即使是精心设计的域专用求解器也可能会迅速失败。结合了传统搜索方法的最新作品,例如最佳优先搜索和蒙特卡洛树搜索,以及深度神经网络(DNN)的启发式方法,已经显示出有希望的进步,并且可以解决超出专业求解器以外的大量艰苦计划实例。为了更好地理解这些方法为何起作用,我们研究了基于DNN的最佳优先搜索的政策和价值网络的相互作用,并展示了该策略网络的惊人有效性,并通过价值网络进一步增强了价值网络,作为指导启发式的启发式启发式程序。搜索。为了进一步理解现象,我们研究了搜索算法的成本分布,发现索科巴实例可以具有重尾的运行时分布,左侧和右侧都有尾巴。特别是,我们首次展示了\ textit {左尾巴}的存在,并提出了一个抽象的树模型,可以从经验上解释这些尾巴的外观。该实验表明,政策网络是一种强大的启发式指导搜索的关键作用,这可以通过避免探索成倍的尺寸的子树来导致左尾部具有多项式缩放。我们的结果还证明了与传统组合求解器中广泛使用的随机重新启动的重要性,用于避免左和右重尾巴的基于DNN的搜索方法。
translated by 谷歌翻译
内核岭回归(KRR)最近引起了新的兴趣,因为它可以解释在神经网络训练期间出现的瞬态效应,例如双重下降。在这项工作中,我们研究目标函数与内核之间的对齐方式如何影响KRR的性能。我们专注于截短的KRR(TKRR),该KRR(TKRR)利用一个控制核矩阵的光谱截断的附加参数。我们表明,对于多项式对齐,有一个\ emph {过度对准}制度,其中TKRR可以实现比Full KRR可以实现的要快的速度。 TKRR的速率可以一直提高到参数速率,而全krr的速率则以亚最佳值的限制。这表明,通过在内核方法中利用光谱截断,可以更好地利用目标alignemnt。我们还考虑了带有限制的对准设置,并表明TKRR的正则化表面可以表现出瞬态效应,包括多个下降和非单调行为。我们的结果表明,\ emph {对齐谱}的形状与内核方法的概括性能之间存在很强的关系,无论是在速率和有限样品方面。
translated by 谷歌翻译
我们提出了一种新方法,即校准的非参数扫描统计量(CNSS),以更准确地检测大型现实世界图中的异常模式。扫描统计数据可以通过最大化似然比统计量来确定有趣或意外的连接子图;特别是,非参数扫描统计(NPSS)识别具有比预期的单独显着节点比例高的子图。但是,我们表明最近提出的NPSS方法被错误地校准了,无法解释统计量超过子图的多样性。这既可以降低微妙信号的检测能力,又导致检测到的子图的精度降低,即使对于更强的信号也是如此。因此,我们开发了一种重新校准NPSS的新统计方法,正确调整了多个假设测试并考虑了基础图结构。虽然基于随机测试的重新校准在计算上是昂贵的,但我们提出了一种有效的(近似)算法和新的,封闭形式的下限(在零假设下,在给定大小的子尺寸的显着节点的预期最大比例上,没有异常模式)。这些进步,加上最近的核心树分解方法的整合,使CNSS能够扩展到大型现实世界图,并在检测到的子学的准确性方面有了很大的提高。与最先进的对应物相比,证明了对半合成和现实数据集的广泛实验,以验证我们提出的方法的有效性。
translated by 谷歌翻译
口语理解(SLU)将自动语音识别(ASR)和自然语言理解(NLU)视为一项统一任务,通常遭受数据稀缺。我们基于元辅助学习来利用ASR和NLU联合培训方法,通过仅利用大量的语音数据来提高低资源SLU任务的性能。这种方法的一个明显优势是,它提供了一个灵活的框架来实施低资源的SLU训练任务,而无需访问任何进一步的语义注释。特别是,NLU模型被视为标签生成网络,以预测文本的意图和插槽标签。多任务网络网络从语音同步训练ASR任务和SLU任务;标签生成网络的预测作为语义目标传递到多任务网络。通过公共CATSLU数据集的实验证明了所提出的算法的效率,该数据集对下游NLU任务产生了更合适的ASR假设。
translated by 谷歌翻译
可变形图像注册是医学图像分析中的关键步骤,用于在一对固定图像和移动图像之间找到非线性空间转换。基于卷积神经网络(CNN)的深度注册方法已被广泛使用,因为它们可以快速和端到端的方式执行图像注册。但是,这些方法通常对具有较大变形的图像对的性能有限。最近,迭代深度注册方法已被用来减轻这种限制,在这种限制中,转换以粗到精细的方式迭代学习。但是,迭代方法不可避免地会延长注册运行时,并倾向于学习每次迭代的单独图像特征,从而阻碍了功能的利用,以便在以后的迭代时促进注册。在这项研究中,我们提出了一个非详细的粗到十五个注册网络(NICE-NET),用于可变形图像注册。在Nice-Net中,我们提出:(i)单个深度累积学习(SDCL)解码器,可以在网络的单个通过(迭代)中累积地学习粗到5的转换,以及(ii)选择性地 - 传播功能学习(SFL)编码器,可以为整个粗到精细的注册过程学习通用图像功能,并根据需要选择性地传播功能。在3D脑磁共振成像(MRI)的六个公共数据集上进行了广泛的实验表明,我们提出的Nice-NET可以超越最新的迭代深度注册方法,而仅需要与非辅助方法类似的运行时间。
translated by 谷歌翻译
为了减少旅行延迟并提高能源效率的策略,在非信号交叉点上连接和自动驾驶汽车(CAV)的排在学术界越来越流行。但是,很少有研究试图建模最佳排大小与交叉路口周围的交通状况之间的关系。为此,这项研究提出了一个基于自动排的基于自主的交叉控制模型,该模型由深钢筋学习(DRL)技术提供动力。该模型框架具有以下两个级别:第一级采用了第一次发球(FCFS)基于预订的策略,该政策与非冲突的车道选择机制集成在一起,以确定车辆的通过优先级;第二级应用深度Q-Network算法来根据交叉路口的实时交通状况识别最佳排尺寸。在交通微模拟器进行测试时,我们提出的模型与最先进的方法相比,在旅行效率和燃料保护方面表现出卓越的性能。
translated by 谷歌翻译
引用视频对象细分任务(RVO)的目的是在所有视频框架中通过语言表达式引用的给定视频中的对象实例。由于需要在各个实例中理解跨模式语义,因此此任务比传统的半监督视频对象细分更具挑战性,在该视频对象分割中,在第一帧中给出了地面真相对象掩盖。随着变压器在对象检测和对象细分方面的巨大成就,RVOS已取得了显着的进步,而Reformen to Reformer实现了最新的性能。在这项工作中,基于强大的基线框架 - 引用者,我们提出了几个技巧来进一步提高,包括周期性学习率,半监督方法和测试时间增加推断。改进的推荐子在CVPR2022上排名第二,参考YouTube-VOS挑战。
translated by 谷歌翻译