推荐系统

日报

生成式检索加速落地：今日多篇论文聚焦生成式检索的工业部署瓶颈。FlashTrie 用 GPU 加速约束波束搜索实现 24 倍加速，CRID 将业务价值编码进 DocID 提升 GMV，PG 用配置驱动解耦特征工程加速迭代。生成式检索正从学术概念走向大规模在线系统。; LLM 推荐走向混合架构：LLM 推荐不再是“全盘替代”，而是与传统 ML 协同。Meta/Amazon 的 Agentic 系统用 LLM 处理非结构化信号、传统模型保证效率；Apple Music 用语义检索补充 token-b

文章详情

推荐系统

日报

LLM 驱动的可解释性与决策智能：今日多篇论文探索了 LLM 在推荐系统中的应用，从生成自然语言解释（RashomonLLM）到作为路由决策的候选模型（LLM Routing）。这表明 LLM 正从单纯的“特征提取器”向“推理与规划引擎”演进，为提升系统可解释性和决策效率提供了新路径。; 理论驱动的在线学习与探索策略：多篇工作聚焦于 bandit 和 Top-k 识别等在线学习问题，并提出了具有理论保证的算法（如 TOFU-POV、渐近最优 Top-k 识别）。这反映了工业界对在有限样本和不确定

本周推荐系统研究围绕三条技术主线展开：生成式检索的工业落地与理论深化、LLM/Agent从概念验证走向真实部署、以及精排/联邦学习在工业环境中的鲁棒性优化。生成式检索加速落地与多兴趣精细化：快手在推送通知系统中部署了异构生成式架构 HGenPush，采用非自回归多token预测替代传统自回归解码，实现DAU提升0.181%。Walmart将库存感知RAG引入赞助搜索，InvAwr-RAG将广告填充率提升68%。理论层面，BACH通过贝叶斯混合头解决多兴趣双塔的路由坍塌问题，在三个基准上刷新召回率；DaV-Gen提出draft-and-verify机制统一生成式检索的效率与精度。此外，Signed MaxSim首次从理论上证明MaxSim的表达力不低于向量内积，并扩展至任意实值内积。 LLM/Agent推荐从原型走向生产： Meta的 SCOReD 是本周最突出的部署工作——通过学生感知的CoT优化将教师推理轨迹适配到小模型，线上获得NDCG+1.56%和Recall@5+1.9%，同时推理长度减少27.3%。Walmart使用LLAMA2 7B+LoRA做广告相关性三分类，准确率89.43%超越GPT-4。学术方面，MMEACR提出双轨记忆架构加强Agent的视觉推理能力；LBR系统性地揭示了LLM推荐中的长度偏差，并提出轻量校正方案（NDCG@5提升16.82%）；综述论文Autonomous Information Seeking为Agent推荐建立了三范式分类法。工业级精排与联邦学习优化：快手的 PIT-SUN 是一种可直接部署的经验边际变换框架，通过对重尾目标进行概率积分变换与期望一致性恢复，在线上全面改善点精度和校准。FeLiX则针对联邦学习中客户端流失问题，提出流式感知可用性层级和延迟鲁棒聚合，将收敛时间缩短2.37倍。

文章详情

推荐系统

日报

多兴趣建模与端到端生成式检索的范式突破：今日两篇工业界高分论文（Amazon BACH、Alibaba DaV-Gen）分别从不同路径挑战传统多阶段级联架构。BACH 用贝叶斯软混合替代硬路由，解决多兴趣头坍塌问题；DaV-Gen 则借鉴投机解码的 Draft-and-Verify 机制，试图统一检索与排序的优化目标。这标志着工业界正从“多阶段拼装”向“端到端联合优化”加速演进。; 回归任务中的长尾与期望一致性成为精排核心挑战：快手与人大合作的 PIT-SUN 论文，聚焦于停留时长、GMV 等长

文章详情

推荐系统

日报

[大模型 Agent 与多模态记忆的深度融合]：今日多篇论文探索了将 LLM Agent 应用于推荐系统的新范式。MMEACR 提出了双轨记忆架构，将 Agent 的符号推理与多模态嵌入匹配分离，并通过属性引导的强化反思机制更新记忆。这标志着 Agent 推荐正从纯文本推理向融合视觉、文本等多模态信号的更精细、更鲁棒的记忆系统演进，为构建可解释、高保真的下一代推荐系统提供了新思路。; [面向生产环境的联邦学习与在线学习优化]：针对推荐系统对模型新鲜度的严苛要求，FeLiX 框架直面客户端流失、数

文章详情

推荐系统

日报

[LLM推理蒸馏走向精细化]：今日多篇论文聚焦于如何高效地将大模型（LLM/VLM）的推理能力迁移到小模型。从Meta的SCOReD（学生感知的CoT轨迹优化）到PORTS（偏好优化对齐检索器与LLM），核心思路不再是简单的SFT，而是根据学生模型的能力动态裁剪、改写教师轨迹，或利用LLM的perplexity信号作为偏好标签，实现更精准、更高效的蒸馏。; [检索模型的理论基础与表达能力受关注]：学术界开始深入探究检索模型（尤其是Late-Interaction模型）的理论上限。UMass的论文

文章详情

推荐系统

日报

生成式推荐进入工业深水区：今日多篇工业论文（快手、阿里、沃尔玛）将生成式推荐从概念验证推向生产部署。核心创新点不再是简单的“用生成替代检索”，而是聚焦于异构内容生成（同时推荐视频和作者）、库存感知（RAG动态改写广告查询）以及多token预测（替代低效的自回归生成），以解决实际业务中的效率与效果平衡问题。; 重排器价值再发现：从“后处理”到“训练信号”：Yandex的论文提出利用重排器（精排模型）的分数来指导召回嵌入的学习，打破了传统“召回-精排”的流水线隔离。这一趋势表明，工业界正试图将精排模

本周24篇论文中，4篇来自工业在线部署（Meta、Netflix、阿里巴巴、快手），覆盖召回、排序、重排、全链路生成阶段。核心技术密度的分布逻辑在变——生成式推荐从"能生成"走向"能推理"，召回从嵌入匹配转向导航式探索，排序阶段则在约束和解释之间寻找平衡。生成式推荐进入"推理+强化学习"时代： GR2、ShopX和GenPage在同一周展示了三种不同的生成式架构走向。GR2在重排阶段首次引入推理链（CoT）和RL后训练，在工业流量上R@1提升18.7%。ShopX将生成式推荐从候选生成推向"意图到物品"的端到端执行，在淘宝Agent场景下复杂请求满足率提升55-75%。GenPage走得最远——用单Transformer替代Netflix整套多阶段主页流水线，核心指标+0.24%的同时延迟降低20%。三篇的共同指向是：生成式推荐的核心壁垒已从"能否生成"转向"能否在推理质量与部署效率之间找到工业可行解"。召回从静态匹配走向动态图探索： Meta的硬负采样通过LLM聚类生成实时同簇负样本，在线召回率+8.5%、流行度偏差-12.3%。快手的IID-Nav将召回建模为自主图探索，支持间接无限深度遍历。Kuaishou的POEM利用多任务排序分数构建偏序序列，实现请求级别的实时兴趣更新。三条技术路径共享一个趋势：召回正从静态嵌入查询转向动态、上下文感知的行为建模。约束优化与可解释性重回视野： Avito的PermR在5600万搜索查询上证明了相邻交换法能在生产延迟内逼近整数规划收益。KakaoBank的ChunkGroupSHAP用分组Shapley值弥合了词级解释与密集排序器之间的粒度鸿沟。这两个工作提醒行业：在大模型热潮中，渐进式工程优化和可解释性工具仍能产出具象收益。

文章详情

推荐系统

日报

LLM 驱动的个性化与可解释性：今日多篇论文聚焦于利用 LLM 提升推荐系统的个性化和可解释性。Bi-NAS 通过 NAS 搜索最优的 LLM 提示结构，CoPersona 则利用图协同信号补全稀疏用户画像，两者都旨在解决用户历史稀疏问题，提升 LLM 在推荐场景下的鲁棒性和解释质量。; 从静态检索到动态规划：传统推荐召回阶段多采用静态打分，而 `Planning over Matrix-Factorization MDPs` 一文将其建模为马尔可夫决策过程，通过单步前瞻即可显著提升召回效果。这

文章详情

推荐系统

日报

LLM 深度赋能召回与检索：今日多篇论文将大语言模型（LLM）应用于推荐系统的召回阶段，超越了传统的语义匹配。Meta 利用 LLM 聚类生成硬负样本，Baidu 则用 LLM 构建用户画像并优化记忆检索，Amazon 则通过词汇迁移解决现代编码器在稀疏检索中的“词汇鸿沟”问题。这表明 LLM 正从特征提取向核心检索逻辑演进。; 生成式重排与推理加速成为焦点：以 Diffusion-GR2 为代表的生成式重排器，通过链式推理（CoT）提升排序精度，但其自回归解码速度是部署瓶颈。将扩散模型与知识蒸

文章详情

推荐系统

日报

生成式推荐全面渗透推荐全链路：今日多篇重磅论文（Netflix GenPage、GR2、ShopX）共同指向一个趋势：生成式推荐正从传统的候选生成阶段，向精排、重排乃至整个主页构建等全链路环节渗透。核心思路是用一个统一的Transformer/LLM模型，通过自回归或语义ID（SID）的方式，端到端地完成排序、布局生成等任务，替代传统的多阶段流水线。; 强化学习（RL）+ 推理蒸馏成为LLM落地的关键配方：GR2和GenPage都验证了RL在LLM推荐中的巨大潜力，尤其是在重排序和页面生成这类复

文章详情

推荐系统

日报

实时序列建模与多阶段信号融合：工业界（快手）开始利用精排阶段的多任务分数（CTR、观看时长）作为监督信号，构建动态偏序序列，替代传统的静态点击序列。这标志着序列建模从“被动记录”向“主动利用排序信号”的转变，能更精准地捕捉用户实时意图变化，并直接优化业务核心指标（如观看时长）。; 检索范式从“匹配”到“导航”的进化：无论是快手提出的IID-Nav（图导航）还是学术界对RAG检索瓶颈的诊断，都表明传统的静态相似度匹配（i2i）已无法满足复杂场景需求。新的趋势是将检索建模为状态化、多步的自主探索过程

文章详情

1 2 3 4 5 6

...