智能论文笔记

Recommender Transformers with Behavior Pathways

Zhiyu Yao , Xinyang Chen , Sinan Wang , Qinyan Dai , Yumeng Li , Tanchao Zhu , Mingsheng Long

分类：机器学习

2022-06-13

顺序建议要求推荐人从已记录的用户行为数据中捕获不断发展的行为特征，以进行准确的建议。但是，用户行为序列被视为具有多个正在进行的线程交织在一起的脚本。我们发现，只有一小部分关键行为才能发展为用户的未来动作。结果，用户的未来行为很难预测。我们将每个用户作为行为途径的顺序行为的特征得出结论。不同的用户具有独特的行为途径。在现有的顺序模型中，变压器在捕获全球依赖性特征方面表现出很大的能力。但是，这些模型主要使用自我注意力的机制在所有先前的行为上提供了密集的分布，这使得最终预测被未调整给每个用户的微不足道行为所淹没。在本文中，我们使用新颖的途径注意机制构建了推荐变压器（RETR）。 REOR可以动态地计划为每个用户指定的行为途径，并通过此行为途径很少激活网络，以有效捕获对推荐有用的演变模式。关键设计是一种博学的二进制途径，以防止行为途径被微不足道的行为淹没。我们从经验上验证了RERO在七个现实世界数据集中的有效性，并产生了最先进的性能。

translated by 谷歌翻译

Multi-Behavior Hypergraph-Enhanced Transformer for Sequential Recommendation

Yuhao Yang , Chao Huang , Lianghao Xia , Yuxuan Liang , Yanwei Yu , Chenliang Li

分类：人工智能

2022-07-12

对于许多在线平台（例如，视频共享网站，电子商务系统），学习动态用户的偏好已成为越来越重要的组成部分，以提出顺序建议。先前的工作已经做出了许多努力，以基于各种体系结构（例如，经常性的神经网络和自我注意机制）对用户交互序列进行建模项目项目过渡。最近出现的图形神经网络还用作有用的骨干模型，可在顺序推荐方案中捕获项目依赖性。尽管它们有效，但现有的方法却远远集中在具有单一相互作用类型的项目序列表示上，因此仅限于捕获用户和项目之间的动态异质关系结构（例如，页面视图，添加最佳选择，购买，购买）。为了应对这一挑战，我们设计了多行为超毛力增强的变压器框架（MBHT），以捕获短期和长期跨型行为依赖性。具体而言，多尺度变压器配备了低级别的自我注意力，可从细粒度和粗粒水平的共同编码行为感知的顺序模式。此外，我们将全局多行为依赖性纳入HyperGraph神经体系结构中，以自定义的方式捕获层次长期项目相关性。实验结果证明了我们MBHT在不同环境中的各种最新推荐解决方案的优势。进一步的消融研究证明了我们的模型设计和新MBHT框架的好处的有效性。我们的实施代码在以下网址发布：https：//github.com/yuh-yang/mbht-kdd22。

translated by 谷歌翻译

Multi-Interactive Attention Network for Fine-grained Feature Learning in CTR Prediction

Kai Zhang , Hao Qian , Qing Cui , Qi Liu , Longfei Li , Jun Zhou , Jianhui Ma , Enhong Chen

分类：人工智能

2020-12-13

在点击率（CTR）预测方案中，用户的顺序行为很好地利用来捕获最近文献中的用户兴趣。然而，尽管正在广泛研究，但这些顺序方法仍然存在三个限制。首先，现有方法主要利用对用户行为的注意，这并不总是适用于CTR预测，因为用户经常点击与任何历史行为无关的新产品。其次，在真实场景中，很久以前存在许多具有运营的用户，但最近的次数相对不活跃。因此，难以通过早期行为精确地捕获用户的当前偏好。第三，不同特征子空间中用户历史行为的多个表示主要被忽略。为了解决这些问题，我们提出了一种多互动关注网络（Mian），全面提取各种细粒度特征之间的潜在关系（例如，性别，年龄和用户档案）。具体而言，MIAN包含多交互式层（MIL），其集成了三个本地交互模块，通过顺序行为捕获用户偏好的多个表示，并同时利用细粒度的用户特定的以及上下文信息。此外，我们设计了一个全局交互模块（GIM）来学习高阶交互，平衡多个功能的不同影响。最后，脱机实验结果来自三个数据集，以及在大型推荐系统中的在线A / B测试，展示了我们提出的方法的有效性。

translated by 谷歌翻译

AMEIR: Automatic Behavior Modeling, Interaction Exploration and MLP Investigation in the Recommender System

Pengyu Zhao , Kecheng Xiao , Yuanxing Zhang , Kaigui Bian , Wei Yan

分类：机器学习 | (统计)机器学习

2020-06-10

最近，深度学习模型已在工业推荐系统中广泛传播，并提高了建议质量。尽管取得了杰出的成功，但任务吸引推荐系统的设计通常需要域专家的手动功能工程和建筑工程。为了减轻人类的努力，我们探索了神经体系结构搜索（NAS）的潜力，并在推荐系统中引入了自动行为建模，互动探索和多层感知器（MLP）研究的AMEIR。 Ameir的核心贡献是三阶段的搜索空间和量身定制的三步搜索管道。具体而言，Ameir将完整的建议模型分为行为建模，交互探索，MLP聚合的三个阶段，并引入了一个新颖的搜索空间，其中包含三个量身定制的子空间，这些子空间涵盖了大多数现有方法，从而允许搜索更好的模型。为了有效，有效地找到理想的体系结构，Ameir在三个阶段逐渐推荐中实现了一次弹奏随机搜索，并将搜索结果组装为最终结果。进一步的分析表明，Ameir的搜索空间可以涵盖大多数代表性推荐模型，这证明了我们设计的普遍性。在各种情况下进行的广泛实验表明，AMEIR的表现优于精心制作的手动设计的竞争基准和领先的算法复杂的NAS方法，具有较低的模型复杂性和可比的时间成本，表明所提出的方法的效率，效率和鲁棒性。

translated by 谷歌翻译

Learn Basic Skills and Reuse: Modularized Adaptive Neural Architecture Search (MANAS)

Hanxiong Chen , Yunqi Li , He Zhu , Yongfeng Zhang

分类：机器学习 | 人工智能

2022-08-23

人类智能能够首先学习一些基本技能，以解决基本问题，然后将这种基本技能融合到解决复杂或新问题的复杂技能中。例如，基本技能``挖洞''，``放树，'''``回填''和``浇水'''构成复杂的技能``植物''。此外，可以重复使用一些基本技能来解决其他问题。例如，基本技能``挖洞''不仅可以用于种植树木，而且还可以用于采矿，建造排水管或垃圾填埋场。学习基本技能并重复使用各种任务的能力对人类非常重要，因为它有助于避免学习太多的技能来解决每个任务，并可以通过仅学习几个数量来解决组成数量的任务数量基本技能，可以节省人脑中大量的记忆和计算。我们认为，机器智能还应捕捉学习基本技能并通过构成复杂技能的能力。在计算机科学语言中，每种基本技能都是“模块”，它是一个可重复使用的具体含义的网络，并执行特定的基本操作。将模块组装成更大的``模型''，以完成更复杂的任务。组装过程适应输入或任务，即，对于给定的任务，应该将模块组装成解决任务的最合适的模型中。结果，不同的输入或任务可能具有不同的组装模型，从而实现自组装AI。在这项工作中，我们提出了模块化的自适应神经体系结构搜索（MANAS），以演示上述想法。不同数据集上的实验表明，MANAS组装的自适应体系结构优于静态全局体系结构。进一步的实验和经验分析为魔力的有效性提供了见解。

translated by 谷歌翻译

HTML版本

D-HAN: Dynamic News Recommendation with Hierarchical Attention Network

Qinghua Zhao , Xu Chen , Hui Zhang , Shuai Ma

分类：人工智能

2021-12-19

新闻建议是现代社会中有效的信息传播解决方案。虽然近年来已经见证了许多有前途的新闻推荐模型，但它们主要以静态方式捕获文件级上的用户新交互。然而，在现实世界的情景中，新闻可以很复杂和多样化，盲目地将所有内容挤压到嵌入式矢量中，在提取与用户的个性化偏好兼容的信息中可以不太有效。此外，新闻推荐方案中的用户偏好可以是高度动态的，并且应该设计定制的动态机制以获得更好的推荐性能。在本文中，我们提出了一种新颖的动态新闻推荐模型。为了更好地理解新闻内容，我们利用注意机制分别代表了从句子，元素和文档级别的消息。为了捕获用户的动态偏好，连续时间信息无缝地结合到关注权重的计算中。更具体地，我们设计了一个分层关注网络，其中下层学习不同句子和元素的重要性，并且上层捕获先前互动和目标新闻之间的相关性。为了全面模型动态字符，我们首先通过结合绝对和相对时间信息来增强传统的关注机制，然后我们提出了一种动态的负采样方法来优化用户的隐式反馈。我们基于三个现实世界数据集进行广泛的实验，以展示我们的模型的效果。我们的源代码和预先训练的表示在https://github.com/lshowway/d-han提供。

translated by 谷歌翻译

Generating Negative Samples for Sequential Recommendation

Yongjun Chen , Jia Li , Zhiwei Liu , Nitish Shirish Keskar , Huan Wang , Julian McAuley , Caiming Xiong

分类：人工智能

2022-08-07

为了成功推荐（SR）成功，最近的作品着重于设计有效的顺序编码器，融合侧面信息以及挖掘额外的积极的自我实施信号。在每个时间步骤中对负面项目进行采样的策略较少探索。由于用户在培训过程中的兴趣和模型更新的动态，因此考虑用户的非相互作用项目的随机抽样项目作为负面的项目可能是不明智的。结果，该模型将不准确地了解用户对项目的偏好。识别信息性负面因素是具有挑战性的，因为内容的负面项目与动态变化的兴趣和模型参数相关（并且抽样过程也应该是有效的）。为此，我们建议为SR（Genni）生成负样本（项目）。根据当前SR模型对项目的学习用户偏好，在每个时间步骤中都采样了负项目。提出了有效的实施，以进一步加速生成过程，使其可扩展到大规模推荐任务。在四个公共数据集上进行的广泛实验验证了为SR提供高质量的负样本的重要性，并证明了Genni的有效性和效率。

translated by 谷歌翻译

Coarse-to-Fine Knowledge-Enhanced Multi-Interest Learning Framework for Multi-Behavior Recommendation

Chang Meng , Ziqi Zhao , Wei Guo , Yingxue Zhang , Haolun Wu , Chen Gao , Dong Li , Xiu Li , Ruiming Tang

分类：人工智能

2022-08-03

在大多数现实世界中的推荐方案中，多种行为（例如，单击，添加到购物车，采购等）的多类型，这对于学习用户的多方面偏好是有益的。由于多种类型的行为明确表现出依赖性，因此有效地对复杂行为依赖性建模对于多行为预测至关重要。最先进的多行为模型以所有历史互动为输入都没有区别地学习行为依赖性。但是，不同的行为可能反映了用户偏好的不同方面，这意味着某些无关的互动可能会像预测目标行为的声音一样发挥作用。为了解决上述局限性，我们向多行为建议介绍了多功能学习。更具体地说，我们提出了一种新颖的粗到五个知识增强的多功能学习（CKML）框架，以学习不同行为的共享和特定于行为的利益。 CKML引入了两个高级模块，即粗粒兴趣提取（CIE）和细粒度的行为相关性（FBC），它们共同起作用以捕获细粒度的行为依赖性。 CIE使用知识感知信息来提取每个兴趣的初始表示。 FBC结合了动态路由方案，以在兴趣之间进一步分配每个行为。此外，我们使用自我注意机制在兴趣水平上将不同的行为信息相关联。三个现实世界数据集的经验结果验证了我们模型在利用多行为数据方面的有效性和效率。进一步的实验证明了每个模块的有效性以及多行为数据共享和特定建模范式的鲁棒性和优越性。

translated by 谷歌翻译

Heterogeneous Global Graph Neural Networks for Personalized Session-based Recommendation

Yitong Pang , Lingfei Wu , Qi Shen , Yiming Zhang , Zhihua Wei , Fangli Xu , Ethan Chang , Bo Long , Jian Pei

分类：人工智能

2021-07-08

预测短期交互会话的下一个交互是基于会话的推荐中的一个具有挑战性的任务。几乎所有现有的作品都依赖于项目转换模式，并在建模用户偏好时忽略用户历史会话的影响，这通常会导致非个性化推荐。此外，基于现有的个性化会话的推荐人仅基于当前用户的会话捕获用户首选项，而是忽略来自其他用户的历史会话的有用物品转换模式。为了解决这些问题，我们提出了一种新颖的异构全球图形神经网络（HG-GNN）以以微妙的方式利用所有会话的物品过渡，以便更好地推断用户偏好与当前和历史会话。为了有效利用所有用户的所有会话转换，我们提出了一种新的异构全局图，该图包含会话，用户项交互和全局共同发生项目的项目转换。此外，为了综合地从会话中捕获用户偏好，我们建议通过两个图形增强偏好编码器学习来自全局图的两个用户表示。具体地，我们在异构全球图上设计一种新的异构图形神经网络（HGNN），以了解具有丰富语义的长期用户偏好和项目表示。基于HGNN，我们提出了当前偏好编码器和历史偏好编码器，分别捕获来自当前和历史会话的不同级别的用户偏好。为实现个性化建议，我们将用户当前偏好和历史利益的表示集成到生成最终用户首选项表示。三个真实数据集的广泛实验结果表明，我们的模型优于其他最先进的方法。

translated by 谷歌翻译

Time-aware Self-Attention Meets Logic Reasoning in Recommender Systems

Zhijian Luo , Zihan Huang , Jiahui Tang , Yueen Hou , Yanzeng Gao

分类：人工智能 | 机器学习

2022-08-29

在大数据时代，推荐系统在我们日常生活中的关键信息过滤表现出了杰出的成功。近年来，推荐系统的技术发展，从感知学习到认知推理，这些认知推理将推荐任务作为逻辑推理的过程，并取得了重大改进。但是，推理中的逻辑陈述隐含地承认有序无关紧要，甚至没有考虑在许多建议任务中起重要作用的时间信息。此外，与时间上下文合并的建议模型往往是自我集中的，即自动更加（少）将相关性（不相关）分别集中在相关性上。为了解决这些问题，在本文中，我们提出了一种基于神经协作推理（TISANCR）的推荐模型的时间感知自我注意力，该模型将时间模式和自我注意机制集成到基于推理的建议中。特别是，以相对时间为代表的时间模式，提供上下文和辅助信息来表征用户在建议方面的偏好，而自我注意力则是利用自我注意力来提炼信息的模式并抑制无关紧要的。因此，自我煽动的时间信息的融合提供了对用户偏好的更深入表示。基准数据集的广泛实验表明，所提出的Tisancr取得了重大改进，并始终优于最先进的建议方法。

translated by 谷歌翻译

Edge-Enhanced Global Disentangled Graph Neural Network for Sequential Recommendation

Yunyi Li , Pengpeng Zhao , Guanfeng Liu , Yanchi Liu , Victor S. Sheng , Jiajie Xu , Xiaofang Zhou

分类：机器学习

2021-11-20

顺序推荐是推荐系统的广泛流行的主题。现有的作品有助于提高基于各种方法的顺序推荐系统的预测能力，例如经常性网络和自我关注机制。然而，他们未能发现和区分项目之间的各种关系，这可能是激励用户行为的潜在因素。在本文中，我们提出了一个边缘增强的全面解散图神经网络（EGD-GNN）模型，以捕获全局项目表示和本地用户意图学习项目之间的关系信息。在全球级别，我们通过所有序列构建全局链接图来模拟项目关系。然后，频道感知的解缠绕学习层被设计成将边缘信息分解为不同的信道，这可以聚合以将目标项从其邻居表示。在本地层面，我们应用一个变化的自动编码器框架来学习用户在当前序列上的意图。我们在三个现实世界数据集中评估我们提出的方法。实验结果表明，我们的模型可以通过最先进的基线获得至关重要的改进，能够区分项目特征。

translated by 谷歌翻译

BERT4Loc: BERT for Location -- POI Recommender System

Syed Raza Bashir , Vojislav Misic

分类：人工智能

2022-08-02

推荐兴趣点是一个困难的问题，需要从基于位置的社交媒体平台中提取精确的位置信息。对于这种位置感知的推荐系统而言，另一个具有挑战性和关键的问题是根据用户的历史行为对用户的偏好进行建模。我们建议使用Transformers的双向编码器表示的位置感知建议系统，以便为用户提供基于位置的建议。提出的模型包含位置数据和用户偏好。与在序列中预测每个位置的下一项（位置）相比，我们的模型可以为用户提供更相关的结果。基准数据集上的广泛实验表明，我们的模型始终优于各种最新的顺序模型。

translated by 谷歌翻译

RecGURU: Adversarial Learning of Generalized User Representations for Cross-Domain Recommendation

Chenglin Li , Mingjun Zhao , Huanming Zhang , Chenyun Yu , Lei Cheng , Guoqiang Shu , Beibei Kong , Di Niu

分类：人工智能

2021-11-19

跨域建议可以帮助缓解传统的连续推荐系统中的数据稀疏问题。在本文中，我们提出了Recguru算法框架，以在顺序推荐中生成包含跨域的用户信息的广义用户表示，即使在两个域中的最小或没有公共用户时也是如此。我们提出了一种自我细心的AutoEncoder来导出潜在用户表示，以及域鉴别器，其旨在预测所产生的潜在表示的原点域。我们提出了一种新的逆势学习方法来训练两个模块，以使从不同域生成的用户嵌入到每个用户的单个全局Gur。学习的Gur捕获了用户的整体偏好和特征，因此可以用于增强行为数据并改进在涉及用户的任何单个域中的推荐。在两个公共交叉域推荐数据集以及从现实世界应用程序收集的大型数据集进行了广泛的实验。结果表明，Recguru提高了性能，优于各种最先进的顺序推荐和跨域推荐方法。收集的数据将被释放以促进未来的研究。

translated by 谷歌翻译

TEA: A Sequential Recommendation Framework via Temporally Evolving Aggregations

Zijian Li , Ruichu Cai , Fengzhu Wu , Sili Zhang , Hao Gu , Yuexing Hao , Yuguang

分类：机器学习

2021-11-14

顺序推荐旨在为特定时间戳在特定时间戳提供历史行为中为用户选择最合适的项目。现有方法通常根据像马尔可夫链等转换的方法模拟用户行为序列。然而，这些方法也隐含地假设用户在不考虑用户之间的影响而彼此独立。实际上，这种影响在序列推荐中发挥着重要作用，因为用户的行为容易受其他人的影响。因此，期望聚合用户行为和用户之间的影响，这些用户在时间上演化并涉及用户和项目的异构图。在本文中，我们纳入了动态用户项异构图，提出了一种新的顺序推荐框架。结果，可以考虑历史行为以及用户之间的影响。为此，我们首先将顺序建议形式正式确定估计时间动态异构图和用户行为序列的条件概率的问题。之后，我们利用条件随机字段来聚合异构图形和用户行为以进行概率估计，并采用伪似然方法来得出易行目标函数。最后，我们提供所提出的框架的可扩展和灵活的实现。三个现实世界数据集的实验结果不仅展示了我们所提出的方法的有效性，而且还提供了一些关于顺序推荐的有洞察力的发现。

translated by 谷歌翻译

DDGHM: Dual Dynamic Graph with Hybrid Metric Training for Cross-Domain Sequential Recommendation

Xiaolin Zheng , Jiajie Su , Weiming Liu , Chaochao Chen

分类：人工智能

2022-09-21

顺序推荐（SR）通过对用户在项目之间的过境方式进行建模来表征用户行为不断发展的模式。但是，简短的交互序列限制了现有SR的性能。为了解决这个问题，我们专注于本文中的跨域顺序推荐（CDSR），该建议旨在利用其他域中的信息来提高单个域的顺序建议性能。解决CDSR具有挑战性。一方面，如何保留单个领域的偏好以及整合跨域影响仍然是一个基本问题。另一方面，由于合并序列的长度有限，因此仅利用来自其他域的知识来完全解决数据稀疏问题。为了应对挑战，我们提出了DDGHM，这是CDSR问题的新型框架，其中包括两个主要模块，即双动态图形建模和混合度量训练。前者通过动态构造两级图，即局部图和全局图，捕获内域和域间顺序跃迁，并将它们与融合的细心门控机制结合在一起。后者通过采用混合度量学习来增强用户和项目表示形式，包括实现保持一致性和对比度度量的协作指标，以确保均匀性，以进一步减轻数据稀少性问题并提高预测准确性。我们在两个基准数据集上进行实验，结果证明了DDHMG的有效性。

translated by 谷歌翻译

Reinforcement Learning-enhanced Shared-account Cross-domain Sequential Recommendation

Lei Guo , Jinyu Zhang , Tong Chen , Xinhua Wang , Hongzhi Yin

分类：人工智能 | 机器学习

2022-06-16

共享符合跨域顺序推荐（SCSR）是一项新兴而又具有挑战性的任务，在顺序建议中同时考虑共享符号和跨域特征。 SCSR上的现有作品主要基于复发性神经网络（RNN）和图神经网络（GNN），但他们忽略了一个事实，尽管多个用户共享一个帐户，但一次主要由一个用户占用。这一观察结果促使我们通过专注于其最近的行为来学习更准确的用户特定帐户表示。此外，尽管现有的作品降低了较低的权重与无关紧要的相互作用，但它们仍可能稀释域信息并阻碍跨域建议。为了解决上述问题，我们提出了一种基于增强学习的解决方案，即RL-ISN，该解决方案由基本的跨域推荐剂和基于强化的学习域滤波器组成。具体而言，要在“共享”方案中对帐户表示形式进行建模，基本推荐人首先将用户作为潜在用户的混合行为群，然后利用注意力模型在上面进行用户身份识别。为了减少无关域信息的影响，我们将域过滤器作为层次强化学习任务，在该任务中，使用高级任务来决定是否修改整个转移的序列进一步执行任务以确定是否删除其中的每个交互。为了评估解决方案的性能，我们对两个现实世界数据集进行了广泛的实验，并且实验结果证明了与最先进的建议方法相比，我们的RL-ISN方法的优越性。

translated by 谷歌翻译

Every Preference Changes Differently: Neural Multi-Interest Preference Model with Temporal Dynamics for Recommendation

Hui Shi , Yupeng Gu , Yitong Zhou , Bo Zhao , Sicun Gao , Jishen Zhao

分类：人工智能 | 机器学习

2022-07-14

用户嵌入（用户的矢量化表示）对于推荐系统至关重要。已经提出了许多方法来为用户构建代表性，以找到用于检索任务的类似项目，并且已被证明在工业推荐系统中也有效。最近，人们发现使用多个嵌入式代表用户的能力，希望每个嵌入代表用户对某个主题的兴趣。通过多息表示，重要的是要对用户对不同主题的喜好进行建模以及偏好如何随时间变化。但是，现有方法要么无法估算用户对每个利息的亲和力，要么不合理地假设每个用户的每一个利息随时间而逐渐消失，从而损害了候选人检索的召回。在本文中，我们提出了多功能偏好（MIP）模型，这种方法不仅可以通过更有效地使用用户的顺序参与来为用户产生多种利益因此，可以按比例地从每个利息中检索候选人。在各种工业规模的数据集上进行了广泛的实验，以证明我们方法的有效性。

translated by 谷歌翻译

Accurate Action Recommendation for Smart Home via Two-Level Encoders and Commonsense Knowledge

Hyunsik Jeon , Jongjin Kim , Hoyoung Yoon , Jaeri Lee , U Kang

分类：人工智能 | 机器学习

2022-08-12

我们如何准确推荐用户在家中控制其设备的操作？智能家居的行动建议因其对虚拟助手和物联网（IoT）市场的潜在影响而引起了越来越多的关注。但是，为智能家庭设计有效的动作推荐系统是具有挑战性的，因为它需要处理上下文相关性，考虑到查询的上下文和以前的用户历史，并处理历史上的反复无常意图。在这项工作中，我们提出了Smartsense，这是一种准确的智能家居建议方法。对于个人动作，Smartsense以自我煽动的方式总结了其设备控制及其时间上下文，以反映它们之间相关性的重要性。 SmartSense然后总结了以查询方式考虑查询上下文的用户序列，以从顺序操作中提取与查询相关的模式。 Smartsense还将常识知识从常规数据转移到更好地处理动作序列中的意图。结果，Smartsense解决了针对Smart Home的所有三个主要挑战，并实现了比最佳竞争对手高达9.8％的地图的最先进性能。

translated by 谷歌翻译

Cross-domain User Preference Learning for Cold-start Recommendation

Huiling Zhou , Jie Liu , Zhikang Li , Jin Yu , Hongxia Yang

分类：机器学习

2021-12-07

跨域冷启动推荐是推荐系统越来越新兴的问题。现有的作品主要专注于解决跨域用户推荐或冷启动内容推荐。但是，当新域在早期发展时，它具有类似于源域的潜在用户，但互动较少。从源域中学习用户的偏好并将其转移到目标域中是至关重要的，特别是在具有有限用户反馈的新到达内容上。为了弥合这一差距，我们提出了一个自训练的跨域用户偏好学习（夫妻）框架，针对具有各种语义标签的冷启动推荐，例如视频的项目或视频类型。更具体地，我们考虑三个级别的偏好，包括用户历史，用户内容和用户组提供可靠的推荐。利用由域感知顺序模型表示的用户历史，将频率编码器应用于用于用户内容偏好学习的底层标记。然后，建议具有正交节点表示的分层存储器树以进一步概括域域的用户组偏好。整个框架以一种对比的方式更新，以先进先出（FIFO）队列获得更具独特的表示。两个数据集的广泛实验展示了用户和内容冷启动情况的夫妇效率。通过部署在线A / B一周测试，我们表明夫妇的点击率（CTR）优于淘宝应用程序的其他基线。现在该方法在线为跨域冷微视频推荐服务。

translated by 谷歌翻译

Effective and Efficient Training for Sequential Recommendation Using Cumulative Cross-Entropy Loss

Fangyu Li , Shenbao Yu , Feng Zeng , Fang Yang

分类：机器学习

2023-01-03

Increasing research interests focus on sequential recommender systems, aiming to model dynamic sequence representation precisely. However, the most commonly used loss function in state-of-the-art sequential recommendation models has essential limitations. To name a few, Bayesian Personalized Ranking (BPR) loss suffers the vanishing gradient problem from numerous negative sampling and predictionbiases; Binary Cross-Entropy (BCE) loss subjects to negative sampling numbers, thereby it is likely to ignore valuable negative examples and reduce the training efficiency; Cross-Entropy (CE) loss only focuses on the last timestamp of the training sequence, which causes low utilization of sequence information and results in inferior user sequence representation. To avoid these limitations, in this paper, we propose to calculate Cumulative Cross-Entropy (CCE) loss over the sequence. CCE is simple and direct, which enjoys the virtues of painless deployment, no negative sampling, and effective and efficient training. We conduct extensive experiments on five benchmark datasets to demonstrate the effectiveness and efficiency of CCE. The results show that employing CCE loss on three state-of-the-art models GRU4Rec, SASRec, and S3-Rec can reach 125.63%, 69.90%, and 33.24% average improvement of full ranking NDCG@5, respectively. Using CCE, the performance curve of the models on the test data increases rapidly with the wall clock time, and is superior to that of other loss functions in almost the whole process of model training.

translated by 谷歌翻译