SIGIR 2022

Interpolative Distillation for Unifying Biased and Debiased Recommendation

(用于统一有偏和去偏推荐的插值蒸馏

Abstract:大多数推荐系统通过以下任一方式离线评估模型性能:1)对事实交互的正常偏差测试;或 2) 使用随机对照试验的记录进行去偏试验。事实上,这两个测试都只反映了全貌的一部分:事实交互是从推荐策略中收集的,更好地拟合它们意味着有利于平台获得更高的点击率或转化率;相反,去偏测试消除了系统引起的偏差,因此更能反映用户的真实偏好。尽管如此,我们发现现有模型在两个测试中表现出权衡,并且缺乏在两个测试中都表现良好的方法。 在这项工作中,我们的目标是开发一种双赢的推荐方法,该方法在两个测试中都很强大。这是非常重要的,因为它需要学习一个模型,该模型可以在事实环境(即正常的有偏测试)反事实环境(即去偏测试)中做出准确的预测。为了实现这一目标,我们通过考虑这两种环境来执行环境感知推荐建模。特别是,我们提出了一个插值蒸馏 (InterD) 框架,它通过蒸馏学生模型在用户-项目对级别对有偏和去偏模型进行插值。我们对三个真实世界的数据集进行了两个测试的实验。实证结果证明了 InterD 的合理性和有效性,它在两个测试中都脱颖而出,特别是在不太受欢迎的项目上表现出显着的进步。

(插值蒸馏+有偏测试+去偏测试)

Graph Trend Filtering Networks for Recommendation ***

(用于推荐的图趋势过滤网络)

Abstract:推荐系统旨在为用户提供个性化服务,在我们的日常生活中发挥着越来越重要的作用。推荐系统的关键是根据用户的历史在线行为(例如点击、添加到购物车、购买等)来预测用户与项目交互的可能性有多大。为了利用这些用户-项目交互,越来越多的努力考虑将用户-项目交互作为用户-项目二分图,然后通过图神经网络 (GNN) 在图中执行信息传播。鉴于 GNN 在图形表示学习中的强大功能,这些基于 GNN 的推荐方法显着提高了推荐性能。尽管取得了成功,但大多数现有的基于 GNN 的推荐系统都忽略了由不可靠行为(例如,随机/诱饵点击)产生的特征交互并统一处理所有交互,这可能导致次优和不稳定的性能。在本文中,我们研究了现有的基于 GNN 的推荐方法的缺点(例如,非自适应传播和非鲁棒性)。为了解决这些缺点,我们引入了一种有原则的图趋势协同过滤方法,并提出了图趋势过滤网络推荐(GTN),它可以捕获交互的自适应可靠性。提出了综合实验和消融研究,以验证和理解所提出框架的有效性。我们基于 PyTorch 的实现可用:https://github.com/wenqifan03/GTN-SIGIR2022。

(用户-项目二分图、不可靠行为、CTN)

HIEN: Hierarchical Intention Embedding Network for Click-Through Rate Prediction ***

(用于点击率预测的分层意图嵌入网络)

Abstract:点击率 (CTR) 预测在在线广告和推荐系统中起着重要作用,旨在估计用户点击特定项目的概率。特征交互建模和用户兴趣建模方法是CTR预测中的两个热门领域,近年来得到了广泛的研究。然而,这些方法仍然有两个**局限性。首先,传统方法将项目属性视为ID特征,而忽略了属性之间的结构信息关系依赖性**。其次,当从用户-项目交互中挖掘用户兴趣时,当前模型忽略了不同属性的用户意图和项目意图,这缺乏可解释性。基于这一观察,在本文中,我们提出了一种新方法层次意图嵌入网络 (HIEN),它在构造的属性图中基于自下而上的树聚合考虑属性的依赖关系。HIEN 还捕获用户对不同项目属性的意图以及基于我们提出的分层注意机制的项目意图。在公共和生产数据集上进行的大量实验表明,所提出的模型明显优于最先进的方法。此外,HIEN 可以用作最先进的 CTR 预测方法的输入模块,为这些可能已经在实际系统中大量使用的现有模型带来进一步的性能提升

(分层(考虑结构信息、关系依赖)、意图(属性代表的意图))

NAS-CTR: Efficient Neural Architecture Search for Click-Through Rate Prediction

(用于点击率预测的高效神经架构搜索)

Abstract:点击率(CTR)预测已广泛应用于许多机器学习任务,例如在线广告和个性化推荐。不幸的是,给定特定领域的数据集,从巨大的候选空间中搜索有效的特征交互操作和组合需要大量的专家经验和计算成本。最近,神经架构搜索(NAS)在自动发现高质量网络架构方面取得了巨大成功。然而,由于特征交互操作和组合的多样性,现有的基于 NAS 的工作将架构搜索视为离散搜索空间上的黑盒优化问题,效率低下。因此,探索一种更有效的架构搜索方法至关重要。为了实现这个目标,我们提出了NAS-CTR,一种用于 CTR 预测的可区分神经架构搜索方法。首先,我们设计了一个新颖且富有表现力的架构搜索空间和一个连续的松弛方案,使搜索空间可微。其次,我们将用于 CTR 预测的架构搜索制定为对架构具有离散约束的联合优化问题,并利用近端迭代来解决受约束的优化问题。此外,还提出了一种简单而有效的方法来消除跳跃连接的聚集。广泛的实验结果表明,NAS-CTR 在测试准确性和搜索效率方面都优于 SOTA 人工架构和其他基于 NAS 的方法。

(主要是优化寻找有效特征交互的过程,具体方法没看懂)

Enhancing CTR Prediction with Context-Aware Feature Representation Learning ***

(通过上下文感知的特征表示学习增强CTR预测)

Abstract:CTR预测在现实世界中得到了广泛的应用。许多方法对特征交互进行建模以提高其性能。然而,大多数方法只为每个特征学习固定的表示,而没有考虑每个特征在不同上下文下的不同重要性,导致性能较差。最近,有几种方法尝试学习特征表示的向量级权重,以解决固定表示问题。然而,它们只产生线性变换来改进固定的特征表示,这些表示仍然不够灵活,无法捕捉不同上下文下每个特征的不同重要性。在本文中,我们提出了一个名为特征细化网络 (FRNet) 的新模块,它在不同上下文中为每个特征学习位级(bit-level)的上下文感知特征表示。FRNet 由两个关键组件组成:1)信息提取单元(IEU),它捕获上下文信息和交叉特征关系以指导上下文感知特征细化;2)互补选择门(CSGate),它自适应地将在 IEU 中学习的原始和互补特征表示与比特级权重相结合。值得注意的是,FRNet 与现有的 CTR 方法正交,因此可以应用于许多现有的方法以提高其性能。进行了全面的实验来验证FRNet的有效性、效率和兼容性。

(特征在不同上下文中的重要性,不满足于权重向量,而通过FRNet进行特征的重构,可以直接加在现有的模型上)

ESCM2: Entire Space Counterfactual Multi-Task Model for Post-Click Conversion Rate Estimation.

(用于点击后转化率估计的全空间反事实多任务模型)

(完全没看懂摘要,暂时搁置)

On-Device Next-Item Recommendation with Self-Supervised Knowledge Distillation

(具有自监督知识蒸馏的设备上的下一项推荐)

Abstract:基于会话的推荐系统 (SBR) 越来越受欢迎,因为它们可以在不依赖长期用户配置文件的情况下预测用户兴趣,并支持免登录推荐。现代推荐系统以完全基于服务器的方式运行。为了满足数百万用户的需求,需要频繁的模型维护和对并发用户请求的高速处理,这是以巨大的碳足迹为代价的。同时,用户需要将他们的行为数据甚至包括即时环境上下文上传到服务器,引发公众对隐私的关注。设备上的推荐系统通过注重成本的设置和本地推理来规避这两个问题。然而,由于内存和计算资源有限,设备端推荐系统面临着两个基本挑战:(1) 如何缩小常规模型的尺寸以适应边缘设备?(2)如何保留原有容量

以往的研究大多采用张量分解技术以低压缩率压缩常规推荐模型,以避免性能急剧下降。在本文中,我们通过放松张量分解中维度一致性的约束,探索用于下一项推荐的超紧凑模型为了补偿压缩造成的容量损失,我们开发了一个自我监督的知识蒸馏框架,使压缩模型(学生)能够提取原始数据中的基本信息,并通过嵌入改进长尾项目推荐。与原始模型(教师)的重组策略。在两个基准测试中进行的大量实验表明,在尺寸减小 30 倍的情况下,压缩模型几乎没有精度损失,甚至优于其未压缩的对应物。代码发布在https://github.com/xiaxin1998/OD-Rec。

(主要问题就是缩小模型尺寸的情况下尽可能保留原有容量,通过放松约束+自监督的知识蒸馏框架)

Single-shot Embedding Dimension Search in Recommender System ***

(推荐系统中的单次嵌入维度搜索)

Abstract:作为大多数现代深度推荐系统的重要组成部分,特征嵌入高维稀疏用户/项目特征映射到低维密集嵌入。然而,这些嵌入通常被分配一个统一的维度,存在以下问题:(1)高内存使用和计算成本。(2) 由于次优维度分配导致的次优性能。为了缓解上述问题,一些工作通过将其表述为超参数优化嵌入剪枝问题关注自动嵌入维度搜索。但是,它们要么需要为超参数设计良好的搜索空间,要么需要耗时的优化过程。在本文中,我们提出了一种称为 SSEDS 的 Single-Shot Embedding Dimension Search 方法,它可以通过单次嵌入修剪操作有效地为每个特征字段分配维度,同时保持模型的推荐准确性。具体来说,它引入了一个标准来识别每个特征字段的每个嵌入维度的重要性。因此,SSEDS 可以根据相应的维度重要性排名和预定义的参数预算,通过显式减少冗余嵌入维度来自动获得混合维度嵌入。此外,拟议的 SSEDS 与模型无关,这意味着它可以集成到不同的基础推荐模型中。在 CTR(点击率)预测任务的两个广泛使用的公共数据集上进行了广泛的离线实验,结果表明,即使减少了 90% 的参数,SSEDS 仍然可以实现强大的推荐性能。此外,SSEDS还部署在微信订阅平台上,提供实用的推荐服务。为期7天的在线A/B测试结果表明,SSEDS能够显着提升在线推荐模型的性能,同时降低资源消耗。

(通过单次嵌入修剪为不同特征选择合适的维度,从而很大程度减少了模型的参数,引入了一个标准表示模型嵌入维度的重要性)

可以发现,基本上对嵌入层的修改都是可以直接加在现有模型上进行优化的,目前已经看到三篇这种类型的文章了。

Forest-based Deep Recommender

(基于森林的深度推荐系统)

随着深度学习技术的发展,深度推荐模型在推荐准确率方面也取得了显着提升。然而,由于实践中候选项目数量众多偏好计算成本高,这些方法也存在推荐效率低下的问题。最近提出的基于树的深度推荐模型通过在推荐目标的指导下直接学习树结构和表示来缓解这个问题。然而,这样的模型有两个缺点。首先,分层树中的最大堆假设,其中父节点的偏好应该是其子节点偏好中的最大值,在他们的二元分类目标中很难满足。其次,学习索引只包括一棵树。

为此,我们提出了一种基于深度森林的推荐器(简称 DeFoRec)来进行高效推荐。在 DeFoRec 中,保留训练过程中生成的所有树以形成森林。在学习每棵树的节点表示时,我们必须尽可能满足最大堆假设,并在训练阶段模仿树上的波束搜索行为。这是通过 DeFoRec 将训练任务视为同一级别树节点上的多分类来实现的。然而,树节点的数量随着级别呈指数增长,这使得我们可以在 sampled-softmax 技术的指导下训练偏好模型。实验是在真实世界的数据集上进行的,验证了所提出的偏好模型学习方法和树学习方法的有效性。

Explainable Fairness in Recommendation

(推荐中的可解释公平性)

Abstract:现有关于公平感知推荐的研究主要集中在公平的量化公平推荐模型的开发上,两者都没有研究一个更实质性的问题——识别推荐中模型差异的根本原因。此信息对于推荐系统设计者了解内在推荐机制并提供有关如何提高决策者模型公平性的见解至关重要。幸运的是,随着 Explainable AI 的快速发展,我们可以使用模型可解释性来深入了解模型(不)公平性。在本文中,我们研究了可解释的公平性问题,这有助于深入了解系统为何公平或不公平,并以更明智和统一的方法指导公平推荐系统的设计。特别,我们关注具有特征感知推荐和暴露不公平的常见设置,但所提出的可解释公平框架是通用的,可以应用于其他推荐设置和公平定义。我们提出了一个称为 CEF 的反事实可解释公平性框架,它生成关于模型公平性的解释,可以在不显着损害性能的情况下提高公平性。CEF框架制定了一个优化问题来学习输入特征的“最小”变化,从而将推荐结果改变到一定程度的公平性。基于每个特征的反事实推荐结果,我们根据fairness-utility trade-off 对所有基于特征的解释进行排序,并选择顶部的作为公平性解释。

User-controllable Recommendation Against Filter Bubble

(针对过滤气泡的用户可控推荐)

Abstract:推荐系统通常面临过滤气泡的问题:基于用户特征和历史交互过度推荐同类项目。过滤气泡会沿着反馈循环增长,无意中缩小用户兴趣范围。现有工作通常通过结合准确性以外的目标(例如多样性和公平性)来减轻过滤气泡。然而,它们通常会牺牲准确性,损害模型保真度和用户体验。更糟糕的是,用户不得不被动地接受推荐策略并以具有高延迟的低效方式影响系统,例如,不断提供反馈(例如,喜欢和不喜欢)直到系统识别出用户意图。

这项工作提出了一种称为用户可控推荐系统 (UCRS) 的新推荐器原型,它使用户能够主动控制过滤气泡的缓解。在功能上,1) UCRS 可以在用户深深陷入过滤气泡时提醒用户。2) UCRS 支持四种控制命令供用户在不同粒度上缓解气泡。3) UCRS 可以响应控制并即时调整建议。调整的关键在于阻止过时的用户表征对推荐的影响,其中包含与控制命令不一致的历史信息。因此,我们开发了一个因果关系增强的用户可控推理 (UCI) 框架,它可以在推理阶段根据用户控制快速修改推荐,并利用反事实推理来减轻过时用户表示的影响。在三个数据集上的实验验证了 UCI 框架可以根据用户控制有效地推荐更多想要的项目,在准确性和多样性方面都表现出了良好的性能。

(过滤气泡问题、多样性牺牲公平性、用户被动低效反馈,提出用户可控的推荐系统、修改历史表征的影响)

Unify Local and Global Information for Top-N Recommendation

(统一本地和全局信息用于Top-N推荐)

Abstract:知识图谱 (KG) 集成了复杂的信息并包含丰富的语义,被广泛认为是增强推荐系统的辅助信息。然而,大多数现有的基于知识图谱的方法都集中在对图中的结构信息进行编码,而没有利用用户-项目交互数据中的协作信号,这对于理解用户偏好很重要。因此,这些模型学习到的表示不足以表示推荐环境中用户和项目的语义信息。两种数据的结合为解决这个问题提供了一个很好的机会,但它面临以下挑战:i)用户-项目交互数据中的内在关联很难从用户或项目的一侧捕获;ii) 捕获整个 KG 上的知识关联会引入噪声并对推荐结果产生不同程度的影响;iii) 两种数据之间的语义鸿沟难以消除。

为了解决这一研究差距,我们提出了一种名为 KADM 的新型二重奏表示学习框架,以融合局部信息(用户-项目交互数据)和全局信息(外部知识图)以进行前 N 推荐,它由两个独立的子模型组成楷模。一种通过使用知识感知共同注意机制发现局部信息中的内部相关性来学习局部表示,另一种通过使用关系感知注意网络对全局信息中的知识关联进行编码来学习全局表示。这两个子模型作为语义融合网络的一部分被联合训练以计算用户偏好,这区分了两个子模型在特殊上下文下的贡献。我们对两个真实世界的数据集进行实验,评估表明,KADM 明显优于最先进的方法。进一步的消融研究证实,二重架构在推荐任务上的表现明显优于任一子模型

(目前专注于知识图谱的全局信息学习,但是缺乏对用户项目特征交互的关注,目前来看这两者有一定冲突、会互相影响,提出一个双重架构的模型,两个独立的子模型联合训练)

Less is More: Reweighting Important Spectral Graph Features for Recommendation

(为推荐重新赋权重要的光谱图特征)

Abstract:尽管图卷积网络 (GCN) 在推荐系统和协同过滤 (CF) 方面取得了巨大的成功,但它们,尤其是核心组件(\textiti.e.,邻域聚合)如何促进推荐的机制并没用被理想地研究。为了揭示 GCN 在推荐方面的有效性,我们首先从谱的角度对其进行分析,并发现了两个重要发现:(1)只有一小部分强调邻域平滑度和差异的谱图特征有助于推荐的准确性,而大多数图信息可以被视为甚至降低性能的噪声,并且(2)邻域聚合的重复强调平滑的特征并以无效的方式滤除噪声信息。基于以上两个发现,我们提出了一种新的 GCN 学习方案,通过用简单而有效的图去噪编码器 (GDE) 代替邻域聚合来进行推荐,它充当带通滤波器来捕获重要的图特征。我们表明,我们提出的方法减轻了过度平滑,并且与可以考虑任意跳邻域的无限层 GCN 相当。最后,我们在不引入额外复杂性的情况下动态调整负样本的梯度以加快模型训练。对五个真实世界数据集的广泛实验表明,我们提出的方法不仅优于最先进的技术,而且比 LightGCN 实现了 12 倍的加速。

A Review-aware Graph Contrastive Learning Framework for Recommendation

(一个用于推荐的评论感知图对比学习框架)

Abstract:大多数现代推荐系统通过两个部分预测用户的偏好:用户和项目嵌入学习,然后是用户-项目交互建模。通过利用伴随用户评分的辅助评论信息,许多现有的基于评论的推荐模型通过历史评论或在可用的用户-项目目标评论的帮助下更好地建模用户-项目交互来丰富用户/项目嵌入学习能力。尽管取得了重大进展,但我们认为当前基于评论的推荐解决方案存在两个缺点。首先,由于基于评论的推荐可以自然地形成一个用户-项目二分图,具有来自相应用户-项目评论的边缘特征,如何更好地利用这种独特的图结构进行推荐?第二,虽然当前大多数模型的用户行为有限,但我们能否利用评论感知图中独特的自我监督信号来更好地指导两个推荐组件?为此,在本文中,我们提出了一种新颖的评论感知图对比学习 (RGCL) 框架,用于基于评论的推荐。具体来说,我们首先构建一个具有来自评论的特征增强边的评论感知用户-项目图,其中每个边缘特征由用户-项目评分和相应的评论语义组成。这个带有特征增强边的图可以帮助仔细学习每个邻居节点的权重,用于用户和项目表示学习。之后,我们设计了两个额外的对比学习任务(即 Node Discrimination and Edge Discrimination)为推荐过程中的两个组件提供自监督信号。最后,对五个基准数据集的广泛实验证明了我们提出的 RGCL 与最先进的基线相比的优越性。

(用户-项目二分图+评论感知的特征增强边+对比学习)

Are Graph Augmentations Necessary?: Simple Graph Contrastive Learning for Recommendation

(图扩充是否必要?:用于推荐的简单图对比学习)

Abstract:对比学习 (CL) 最近在推荐领域激发了一系列富有成果的研究,因为它从原始数据中提取自我监督信号的能力与推荐系统解决数据稀疏性问题的需求完全一致。基于 CL 的推荐模型的典型流程是首先使用结构扰动扩充用户-项目二部图,然后最大化不同图扩充之间的节点表示一致性。尽管这种范式被证明是有效的,但性能提升的基础仍然是个谜。在本文中,我们首先通过实验揭示,在基于 CL 的推荐模型中,CL 通过学习更统一的用户/项目表示来运作,这可以隐含地减轻流行偏差。同时,我们揭示了图形扩充,曾经被认为是必要的,只是起到了微不足道的作用。基于这一发现,我们提出了一种简单的 CL 方法,该方法丢弃图形扩充,而是向嵌入空间添加均匀噪声以创建对比视图。对三个基准数据集的综合实验研究表明,虽然它看起来非常简单,但所提出的方法可以平滑地调整学习表示的均匀性,并且在推荐准确性和训练效率方面比基于图增强的方法具有明显的优势。代码发布在 https://github.com/Coder-Yu/QRec。

(对比学习通常被认为和图扩充相关,但是实际并不相关,因此丢弃图形扩充)

AutoLossGen: Automatic Loss Function Generation for Recommender Systems

(推荐系统的自动损失函数生成)

Abstract:在推荐系统中,损失函数的选择至关重要,因为良好的损失可能会显着提高模型性能。然而,由于问题的复杂性,手动设计一个好的损失是一个很大的挑战。以前的大部分工作都集中在手工制作的损失函数上,这需要大量的专业知识和人力。在本文中,受最近自动化机器学习发展的启发,我们提出了一种自动损失函数生成框架 AutoLossGen,它能够直接从基本数学运算符构建生成损失函数,而无需先验损失结构知识。更具体地说,我们开发了一个由强化学习驱动的控制器模型来生成损失函数,并制定迭代和交替优化计划来更新控制器模型和推荐模型的参数。推荐系统中自动损失生成的一个挑战是推荐数据集的极度稀疏性,这导致了损失生成和搜索的稀疏奖励问题。为了解决这个问题,我们进一步开发了一种奖励过滤机制,以有效地产生损失。实验结果表明,我们的框架设法为不同的推荐模型和数据集创建定制的损失函数,并且生成的损失比常用的基线损失提供更好的推荐性能。此外,大部分产生的损失是可转移的,即基于一个模型和数据集产生的损失也适用于另一个模型或数据集。

对比学习专题

(感觉数据/特征增强似乎是其中一个很常见的技术)

SIGIR2022

Hypergraph Contrastive Collaborative Filtering

(超图对比协同过滤)

Abstract:协同过滤 (CF) 已成为将用户和项目参数化到潜在表示空间的基本范例,以及来自交互数据的相关模式。在各种 CF 技术中,基于 GNN 的推荐系统(例如 PinSage 和 LightGCN)的开发提供了最先进的性能。然而,现有解决方案尚未很好地探索两个关键挑战:i)更深层次的基于图的 CF 架构的过度平滑效应可能导致无法区分的用户表示和推荐结果的退化。ii) 监督信号(即用户-项目交互)在现实中通常稀缺且分布不均,这限制了 CF 范式的表示能力。为了应对这些挑战,我们提出了一种新的自监督推荐框架超图对比协同过滤(HCCF),以通过超图增强的跨视图对比学习架构共同捕获本地和全球协作关系。特别是,设计的超图结构学习增强了基于 GNN 的 CF 范式的辨别能力,全面捕获用户之间复杂的高阶依赖关系。此外,我们的 HCCF 模型有效地将超图结构编码与自我监督学习相结合,以基于超图自判别来增强推荐系统的表示质量。在三个基准数据集上进行的大量实验证明了我们的模型优于各种最先进的推荐方法,以及针对稀疏用户交互数据的鲁棒性。实现代码可在 https://github.com/akaxlh/HCCF 获得。

A Review-aware Graph Contrastive Learning Framework for Recommendation

(一个用于推荐的评论感知图对比学习框架)

Abstract:大多数现代推荐系统通过两个部分预测用户的偏好:用户和项目嵌入学习,然后是用户-项目交互建模。通过利用伴随用户评分的辅助评论信息,许多现有的基于评论的推荐模型通过历史评论来丰富用户/项目嵌入学习能力或在可用的用户-项目目标评论的帮助下更好地建模用户-项目交互。尽管取得了重大进展,但我们认为当前基于评论的推荐解决方案存在两个缺点。首先,由于基于评论的推荐可以自然地形成一个用户-项目二分图,具有来自相应用户-项目评论的边缘特征(edge features),如何更好地利用这种独特的图结构进行推荐?第二,虽然当前大多数模型的用户行为有限,但我们能否利用评论感知图中独特的自我监督信号来更好地指导两个推荐组件?为此,在本文中,我们提出了一种新颖的评论感知图对比学习 (RGCL) 框架,用于基于评论的推荐。具体来说,我们首先构建一个具有来自评论的特征增强边的评论感知用户-项目图,其中每个边缘特征由用户-项目评分和相应的评论语义组成。这个带有特征增强边的图可以帮助仔细学习每个邻居节点的权重,用于用户和项目表示学习。之后,我们设计了两个额外的对比学习任务(即 Node Discrimination and Edge Discrimination)为推荐过程中的两个组件提供自监督信号。最后,对五个基准数据集的广泛实验证明了我们提出的 RGCL 与最先进的基线相比的优越性。

Are Graph Augmentations Necessary?: Simple Graph Contrastive Learning for Recommendation

(图扩充是否必要?:用于推荐的简单图对比学习)

Abstract:对比学习 (CL) 最近在推荐领域激发了一系列富有成果的研究,因为它从原始数据中提取自我监督信号的能力与推荐系统解决数据稀疏性问题的需求完全一致。基于 CL 的推荐模型的典型流程是首先使用结构扰动扩充用户-项目二部图,然后最大化不同图扩充之间的节点表示一致性。尽管这种范式被证明是有效的,但性能提升的基础仍然是个谜。在本文中,我们首先通过实验揭示,在基于 CL 的推荐模型中,CL 通过学习更统一的用户/项目表示来运作,这可以隐含地减轻流行偏差。同时,我们揭示了图形扩充,曾经被认为是必要的,只是起到了微不足道的作用。基于这一发现,我们提出了一种简单的 CL 方法,该方法丢弃图形扩充,而是向嵌入空间添加均匀噪声以创建对比视图。对三个基准数据集的综合实验研究表明,虽然它看起来非常简单,但所提出的方法可以平滑地调整学习表示的均匀性,并且在推荐准确性和训练效率方面比基于图增强的方法具有明显的优势。代码发布在 https://github.com/Coder-Yu/QRec。

Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System

(知识感知推荐系统的多层交叉试图对比学习)

Abstract:知识图谱(KG)在推荐系统中扮演着越来越重要的角色。最近,基于图神经网络(GNNs)的模型逐渐成为知识感知推荐(KGR)的主题。然而,基于 GNN 的 KGR 模型存在一个天然的缺陷,即稀疏监督信号问题,这可能使其实际性能有所下降。受近期对比学习在从数据本身挖掘监督信号方面取得的成功的启发,在本文中,我们专注于探索 KG 感知推荐中的对比学习,并提出了一种新的多层次跨视图对比学习机制,称为 MCCLK。与传统的对比学习方法不同,传统的对比学习方法通过统一的数据增强方案(如损坏或丢弃)生成两个图视图,我们综合考虑了 KG 感知推荐的三种不同图视图,包括全局级结构视图、局部级协作和语义视图。具体来说,我们将用户-项目图视为协作视图,将项目-实体图视为语义视图,将用户-项目-实体图视为结构视图。因此,MCCLK 在本地和全局级别的三个视图中执行对比学习,以自我监督的方式挖掘综合图形特征和结构信息。此外,在语义视图中,提出了一种k-最近邻(k NN)项-项语义图构建模块,以捕获先前工作通常忽略的重要项-项语义关系。在三个基准数据集上进行的大量实验表明,我们提出的方法优于现有技术。这些实现可在以下位置获得:https://github.com/CCIIPLab/MCCLK。

Knowledge Graph Contrastive Learning for Recommendation

(用于推荐的知识图对比学习)

Abstract:知识图 (KG) 已被用作有用的辅助信息来提高推荐质量。在这些推荐系统中,知识图谱信息通常包含丰富的事实项目之间固有的语义相关性。然而,此类方法的成功依赖于高质量的知识图谱,并且可能无法学习具有两个挑战的质量表示:i)实体的长尾分布导致 KG 增强项目表示的监督信号稀疏;ii) 真实世界的知识图通常是嘈杂的,并且包含项目和实体之间与主题无关的连接。这种 KG 稀疏性和噪声使得项目-实体依赖关系偏离反映其真实特征,这显著放大了噪声效应并阻碍了用户偏好的准确表示。

为了填补这一研究空白,我们设计了一个通用的知识图谱对比学习框架 (KGCL),它可以减轻知识图谱增强推荐系统的信息噪声。具体来说,我们提出了一种知识图增强模式来抑制信息聚合中的 KG 噪声,并为项目推导出更稳健的知识感知表示。此外,我们利用来自 KG 增强过程的额外监督信号来指导交叉视图对比学习范式,在梯度下降中为无偏见的用户-项目交互提供更大的作用,并进一步抑制噪声。在三个公共数据集上进行的广泛实验证明了我们的 KGCL 优于最先进技术的一贯优势。KGCL 还在具有稀疏用户-项目交互的推荐场景中实现了强大的性能,长尾和嘈杂的 KG 实体。我们的实现代码可在 https://github.com/yuh-yang/KGCL-SIGIR22 获得。

KDD2022

CrossCBR: Cross-view Contrastive Learning for Bundle Recommendation

(用于捆绑推荐的跨视图对比学习)

Abstract:捆绑推荐旨在向用户推荐一组相关的物品,能够一站式地方便地满足用户的各种需求。最近的方法通常利用用户-捆绑用户-项目交互信息来获得用户和捆绑的信息表示,分别对应于捆绑视图和项目视图。然而,他们要么使用没有差异化的统一视图,要么松散地结合两个独立视图的预测,而忽略了两个视图表示之间至关重要的协作关联。

在这项工作中,我们建议通过跨视图对比学习来模拟两种不同视图之间的合作关联。通过鼓励两个单独学习的视图对齐,每个视图都可以从另一个视图中提取互补信息,从而实现相互增强。此外,通过扩大不同用户/捆绑的分散度,增强了表示的自辨别能力。在三个公共数据集上进行的大量实验表明,我们的方法大大优于 SOTA 基线。同时,我们的方法需要最少的三组嵌入(用户、捆绑和项目)参数,并且由于更简洁的图结构和图学习模块,计算成本大大降低。此外,各种消融和模型研究揭开了工作机制的神秘面纱并证明了我们的假设。代码和数据集可在 https://github.com/mysbupt/CrossCBR 获得。

COSTA: Covariance-Preserving Feature Augmentation for Graph Contrastive Learning

(图对比学习的协方差保持特征增强)

Abstract:图对比学习 (GCL) 改进了图表示学习,导致各种下游任务的 SOTA。图扩充步骤是 GCL 的一个重要但很少被研究的步骤。在本文中,我们表明通过图扩充获得的节点嵌入是高度有偏的,在一定程度上限制了对比模型从学习下游任务的判别特征。因此,我们不是研究输入空间中的图扩充,而是建议对隐藏的特征增强。受所谓的矩阵草图的启发,我们提出了 COSTA,这是一种用于 GCL 的新型协方差保留特征空间增强框架,它通过维护原始特征的“良好草图”来生成增强特征。为了突出使用 COSTA 进行特征增强的优越性,我们研究了一种节省内存和计算的单视图设置(除了多视图设置)。我们表明,使用 COSTA 进行的特征扩充与基于图扩充的模型相比取得了可比/更好的结果。

Contrastive Cross-domain Recommendation in Matching

(匹配中的对比跨域推荐)

Abstract:跨域推荐(CDR)旨在借助源域在目标域中提供更好的推荐结果,在现实系统中被广泛使用和探索。然而,匹配(即候选生成)模块中的 CDR 在表示学习和知识迁移中都与数据稀疏性流行偏差问题作斗争。在这项工作中,我们提出了一种用于 CDR 匹配的新型对比跨域推荐 (CCDR) 框架。具体来说,我们构建了一个巨大的多元化偏好网络来捕获反映用户不同兴趣的多种信息,并设计了一个域内对比学习(intra-CL)三个域间对比学习(inter-CL)任务以更好地表示学习和知识转移。intra-CL 通过图形增强在目标域内实现更有效和平衡的训练,而 inter-CL 从用户、分类和邻居方面构建不同类型的跨域交互。在实验中,CCDR 在现实世界系统中的离线和在线评估上取得了显着改进。目前,我们已经在微信头条上部署了CCDR,影响了很多用户。源代码在 https://github.com/lqfarmer/CCDR。

WSDM2022

Contrastive Learning for Representation Degeneration Problem in Sequential Recommendation

(顺序推荐中表征退化问题的对比学习)

Abstract:Transformer 和 BERT 等顺序深度学习模型的最新进展极大地促进了顺序推荐。然而,根据我们的研究,这些模型生成的项目嵌入的分布倾向于退化为各向异性形状这可能导致嵌入之间的语义相似度很高。在本文中,首先提供了这种表示退化问题的实证和理论研究,在此基础上提出了一种新的推荐模型 DuoRec 来改善项目嵌入分布。具体来说,鉴于对比学习的均匀性,为 DuoRec 设计了对比正则化以重塑序列表示的分布。鉴于推荐任务是通过点积测量同一空间中序列表示和项目嵌入之间的相似性来执行的约定,正则化可以隐式应用于项目嵌入分布。现有的对比学习方法主要依赖于通过项目裁剪、屏蔽或重新排序对用户-项目交互序列进行数据级增强,并且很难提供语义一致的增强样本。在 DuoRec 中,提出了一种基于 Dropout 的模型级增强,以实现更好的语义保。此外,还开发了一种新的抽样策略,其中具有相同目标项的序列被选为硬阳性样本。对五个数据集进行的大量实验表明,与基线方法相比,所提出的 DuoRec 模型具有优越的性能。学习表示的可视化结果证实 DuoRec 可以在很大程度上缓解表示退化问题。

Contrastive Meta Learning with Behavior Multiplicity for Recommendation

Abstract:一个消息灵通的推荐框架不仅可以帮助用户识别他们感兴趣的项目,而且有利于各种在线平台(例如电子商务、社交媒体)的收入。传统的推荐模型通常假设用户和物品之间只存在单一类型的交互,而无法从多类型的用户行为数据(例如页面浏览、添加到收藏夹和购买)中对多重用户-物品关系进行建模。虽然最近的一些研究建议捕获不同类型行为之间的依赖关系,但很少探索两个重要的挑战:i) 处理目标行为(例如,购买)下的稀疏监督信号。ii) 通过定制的依赖建模来捕捉个性化的多行为模式。为了应对上述挑战,我们设计了一个新的模型 CML,对比元学习 (CML),为不同用户维护专用的跨类型行为依赖性。特别是,我们提出了一个多行为对比学习框架通过构建的对比损失来提炼跨不同类型行为的可迁移知识。此外,为了捕捉多样化的多行为模式,我们设计了一个对比元网络来为不同用户编码定制的行为异质性。对三个真实世界数据集的广泛实验表明,我们的方法始终优于各种最先进的推荐方法。我们的实证研究进一步表明,对比元学习范式为捕捉推荐中的行为多样性提供了巨大的潜力。我们在以下位置发布了我们的模型实现:https://github.com/weiwei1206/CML.git。

Bringing Your Own View: Graph Contrastive Learning without Prefabricated Data Augmentations

(提出自己的观点:无需预制数据增强的图形对比学习)

Abstract:自我监督最近在其图形学习的新领域蓬勃发展。它促进了对下游任务有益的图形表示;但它的成功可能取决于手工艺领域的知识或通常代价高昂的反复试验。即使是它最先进的代表,图对比学习 (GraphCL),也不能完全摆脱这些需求,因为 GraphCL 使用预制的先验,这反映在图数据增强的临时手动选择上。我们的工作旨在通过回答以下问题来推进 GraphCL:如何表示图增强视图的空间?可以依靠什么原则来学习该空间的先验知识?可以构建什么框架来学习先验与对比学习?因此,我们扩展了增强集中的预制离散先验,到图形生成器参数空间中的可学习连续先验,假设图形先验本身,类似于图像流形的概念,可以通过数据生成来学习。此外,为了形成对比视图而不因先验可学习性而崩溃为琐碎的解决方案,我们利用了信息最小化 (InfoMin) 和信息瓶颈 (InfoBN) 的原则来规范学习的先验。最终,对比学习、InfoMin和InfoBN有机地融入到一个双层优化框架中。我们的原则性和自动化方法已被证明在小图基准上与最先进的图自监督方法(包括 GraphCL)相比具有竞争力;并在大规模图表上表现出更好的普适性,无需借助人类专业知识或下游验证。我们的代码公开发布在 https://github.com/Shen-Lab/GraphCL_Automated。

C²-CRS: Coarse-to-Fine Contrastive Learning for Conversational Recommender System

Abstract:会话推荐系统(CRS)旨在通过自然语言对话向用户推荐合适的项目。为了开发有效的 CRS,一个主要的技术问题是如何从非常有限的对话上下文中准确推断用户偏好。为了解决这个问题,一个有前途的解决方案是合并外部数据以丰富上下文信息。然而,之前的研究主要集中在为某些特定类型的外部数据设计融合模型,这对于建模和利用多类型外部数据并不通用。为了有效地利用多类型外部数据,我们提出了一种新颖的从粗到精的对比学习框架,以改进 CRS 的数据语义融合。在我们的方法中,我们首先从不同的数据信号中提取和表示多粒度语义单元,然后以由粗到细的方式对齐关联的多类型语义单元。为了实现这个框架,我们设计了用于建模用户偏好的粗粒度和细粒度过程,其中前者侧重于更一般、粗粒度的语义融合,后者侧重于更具体、细粒度的语义融合。这种方法可以扩展到合并更多种类的外部数据。对两个公共 CRS 数据集的大量实验证明了我们的方法在推荐和对话任务中的有效性。细粒度语义融合。这种方法可以扩展到合并更多种类的外部数据。

对比学习、图学习、自监督学习热度比较高