推荐系统

日报

LLM 深度融入推荐系统全链路：今日多篇论文展示了 LLM 不再仅是辅助工具，而是直接参与推荐核心环节。从 Google 的实时用户画像生成（召回/排序特征），到 CompRank 的 LLM 重排序，再到 TAA-k 优化 RAG 上下文选择，LLM 正在渗透召回、排序、重排等各个阶段，且开始关注工业级部署的效率和成本问题。; 生成式模型成为解决推荐顽疾的新范式：DiffCold 使用扩散模型解决冷启动中的“跷跷板困境”，通过生成式方法统一冷热物品的表示空间。这表明生成式模型（扩散模型、LLM

文章详情

推荐系统

日报

LLM 的工业级落地：从"能不能用"到"怎么用好"：今日多篇论文聚焦于将 LLM 的语义理解能力以低延迟、低成本的方式融入工业推荐系统。快手提出的 AIR 框架通过离线推理+在线检索组合实现 400 倍加速，是 LLM 在跨域推荐场景中成功落地的典型案例，证明了 LLM 在工业界不再是"空中楼阁"。; 长序列建模的"记忆革命"：从压缩到解耦：针对长序列推荐中线性注意力导致的语义状态沉没问题，快手提出的 SinkRec 通过外部化记忆模块，将重复行为模式从状态中解耦出来，让模型专注于动态变化。这种

文章详情

推荐系统

日报

生成式推荐进入精细化调优阶段：今日多篇论文聚焦于生成式推荐（GR）的落地痛点。从京东的AdaGRPO（自适应门控GRPO解决奖励模型噪声）到Yandex的Gryphon（统一SID生成与物品级评分解决序列似然与相关性目标不一致），再到山大的PRO（理论分析索引-解码间隙），业界正从“能否用GR”转向“如何让GR更鲁棒、更精准、更简化系统”。核心趋势是：在GR框架内引入更精细的控制机制（门控、评分、理论指导），而非推翻范式。; 长序列建模与语义化ID成为工业级推荐标配：Meta的论文展示了在十亿用

文章详情

推荐系统

日报

生成式推荐进入深水区：动态语义ID成为核心战场今日多篇论文（SSRLive、DREAM、CaLIR）聚焦于生成式推荐中的语义ID（SID）问题。业界共识已从“能否用SID做推荐”转向“如何让SID动态适应内容变化和冷启动”。SSRLive提出动态SID解决直播内容快速变化，DREAM通过三阶段框架解决冷启动SID分配，CaLIR则用类别引导的隐式意图推理弥补查询与SID的语义鸿沟。这表明生成式推荐正从静态范式向动态、自适应范式演进。; LLM+RAG成为跨域冷启动的标配方案 DoorDash的

本周推荐系统研究围绕三条技术主线展开。主线1：生成式推荐从“能跑”走向““跑得稳”——语义ID与推理能力成为工业焦点。 Pinterest的UniPinRec实现了检索与排序的全栈统一（线上engagement +1%，延迟-11.1%），跳出了生成式推荐仅做检索的边界。快手的OneReason（线上部署）则揭示了思考模式在生成式推荐中无效的根本原因——感知与认知双因素缺失，并给出三级CoT格式和专化-统一训练的解决方案。两者的共同指向是：生成式推荐的核心瓶颈已从模型架构转移至数据形态（语义ID）与系统协同。主线2：跨域冷启动从“搬特征”到“学迁移”——LLM作为跨域桥接器开始大规模落地。快手的RGCD-Rep（服务4亿+用户）用MLLM推理蒸馏将短视频用户兴趣迁移至直播，冷启动参与度显著提升。Meta的Quantizing Intent论文（线上AUC +1.522%冷启）则将有机feed行为量化为语义ID注入广告排序，证明行为富集度决定跨域迁移质量。两篇的共同发现是：跨域迁移的关键不在对齐特征，而在构建可迁移的语义表征。主线3：LLM/Agent增强推荐走向行业差异化——从通用检索到垂直场景的深度适配。理想汽车的HPRO（132天A/B，销量+9.5%）将偏好优化引入销售线索评分，解决稀疏监督和漏斗层级问题。快手的Taiji（CTR +12.4%，收入+15.2%）提出帕累托最优策略优化，在语义与ID之间找到最优权衡点。Syft的DynaTree（生存率提升1.5倍）则用离线智能体建树+在线轻量子树选择解决时间敏感新闻检索的效率问题。这些工作表明，LLM在推荐中的应用正从“通用方案”走向“场景定制”。

文章详情

推荐系统

日报

生成式推荐的推理能力觉醒：以快手 OneReason 为代表，工业界正将 LLM 的“先思考后回答”范式引入生成式推荐。核心挑战在于如何为纯 item token 序列构建有意义的 CoT，OneReason 通过强化 item token 的语义感知（Perception）和用户行为序列的认知重组（Cognition）来激活推理能力，首次在线上场景实现了思考模式优于非思考模式。; 冷启动问题的新解法：不对称结构与监督学习：本周两篇论文从不同角度切入冷启动。Tubi 提出不对称图架构（Shall

文章详情

推荐系统

日报

LLM 深度融入推荐全链路：今日论文显示，LLM 的应用已从简单的特征增强，深入到精排（HPRO）、召回（RGCD-Rep）、特征工程（DSIRM）等核心环节。方法上不再局限于文本生成，而是利用 LLM 的语义理解能力进行判别式排序、知识蒸馏和偏好建模，工业落地验证效果显著。; 跨域与冷启动问题的新解法：多篇论文聚焦于利用富域（如短视频）的丰富信号，通过可迁移表示学习（RGCD-Rep）或偏好对生成（HPRO）来缓解目标域（如直播、销售线索）的稀疏监督和冷启动问题。核心思路是借助 LLM/MLL

文章详情

推荐系统

日报

LLM 增强推荐走向工业落地与精细化对齐：今日多篇论文聚焦 LLM 与推荐系统的深度融合，从概念验证迈向大规模工业部署。快手的 Taiji 框架直接部署于日活 4 亿+的广告平台，通过帕累托最优策略优化（POPO）解决了 LLM 语义空间与推荐 ID 空间的权衡问题。同时，腾讯的 R3 和中科院的 BAHSD 分别从 Agent 技能检索和黑盒蒸馏角度，探索了 LLM 在推荐系统不同环节的精细化应用，体现了业界对 LLM 落地可行性和收益的务实追求。; 序列推荐建模向多尺度、自适应与可解释性演进

文章详情

推荐系统

日报

生成式推荐进入"全栈统一"与"表示优化"深水区：今日多篇论文（UniPinRec、PrefixMem、DRQ）聚焦于生成式推荐（Semantic ID）的工业化落地。趋势从"用LLM生成推荐"转向"如何高效、鲁棒地表示和利用Semantic ID"，包括统一检索与排序的全栈架构（UniPinRec）、为SID设计专用编码器（PrefixMem）、以及解耦量化提升鲁棒性（DRQ）。这表明生成式推荐正从概念验证走向大规模系统部署，核心瓶颈已从"能否用"变为"如何用好"。; 跨域/跨模态信号迁移成为工

文章详情

推荐系统

日报

Agent 驱动的检索与推理：今日多篇论文探索了 Agent 范式在推荐系统中的应用。DynaTree 利用多 Agent 协作构建离线检索树，实现高效的在线新闻检索；DCRC 则训练一个数据为中心的 Agent 来编译可执行的推理程序，以解决金融 QA 中的数值幻觉问题。这表明 Agent 正在从单纯的对话式交互，向更复杂的、结构化的离线规划与在线执行解耦的方向演进。; 从“模型为中心”到“数据/系统为中心”的范式转移：多篇论文不再单纯优化模型架构，而是从数据或系统层面寻求突破。V-SPLAD

本周推荐系统研究围绕三条技术主线展开。工业级知识蒸馏进入迁移率量化时代：字节跳动、Meta、微软、阿里分别展示了大规模蒸馏框架。字节的Rec-Distill（24B教师、20K序列）实现蒸馏迁移率>60%，阿里GPlan将LLM推理压缩为隐式token，Meta的LoopFM通过结构化中间表示让蒸馏迁移率翻倍，微软HARNESS-LM以190M参数恢复教师98%精度。四篇的共同指向是——蒸馏已经不只是模型压缩手段，而是把大模型能力“货币化”为可量化的业务指标。生成式推荐从项目生成走向意图序列与条件生成：阿里QGS在Quark搜索部署conditional next-item预测，Netflix揭示1B参数生成式推荐中不同任务的缩放天花板，清华SID碰撞分析发现Hit@10被高估103%。三篇共同说明——生成式推荐正在进入精细化评估和条件控制阶段。推荐系统缩放从“堆参数”转向多维协同与测试时计算： Coupang系统研究CVR模型在骨干、嵌入、数据三个维度的可加缩放效应；阿里UTTSI首次将test-time compute引入CTR，无模型修改下CTR提升5.3%；Meta的rank-aware decomposition使DLRM吞吐量提升87.5%。缩放的核心矛盾已从“能不能大”变为“怎么用得巧”。

文章详情

推荐系统

日报

大模型知识迁移与蒸馏成为工业界核心战场：今日多篇工业界论文（阿里GPlan、字节Rec-Distill、Meta LoopFM）聚焦于如何将大模型（LLM或Foundation Model）的推理能力或表征知识高效迁移至轻量级服务模型。核心创新点从传统的标量蒸馏转向结构化知识（如隐式推理token、中间层嵌入、历史表示）的传递，旨在突破知识迁移率瓶颈，实现线上部署的精度与延迟平衡。; 推荐系统进入“生成式”与“规划”时代：以阿里GPlan为代表，推荐任务正从“预测下一个点击”向“生成并规划一个意

文章详情

1 2 3 4 5 6

...