推荐周报 2026-W20

本周推荐系统研究围绕三条技术主线展开:生成式推荐架构从tokenizer优化走向推理效率提升,LLM增强推荐从孤立的辅助模块演化为具备记忆与推理能力的智能体,系统工程层的量化与线程编排成为工业部署的实际瓶颈突破点。 主线 1“生成式推荐的解耦与加速”: 阿里在TmallAPP上线 CQ-SID / EG-GRPO,以类别感知语义ID和专家引导强化学习实现GMV +1.15%,生成召回贡献72.63%购买。Tencent与清华的 AsymRec 提出非对称连续-离散框架,用多专家投影替代对称量化,平均提升15.8%。美团的 DIG 将tokenizer嵌入判别式排序模型端到端训练,同时提升检索与排序。Snap的 SID-MLP 用MLP蒸馏替代Transformer解码器,加速8.74倍且精度持平。这些工作的共同指向是——生成式推荐正在从“能跑”向“跑得稳、跑得快”过渡,核心手段是解耦输入输出表示与替换密度过高的结构。 主线 2“LLM推荐向推理与记忆演进”: Microsoft Research的 PGR 引入前瞻引导检索,用Tree-of-Thought扩展查询步骤,在MemoryQuest上召回提升近3倍。美团的 RecRM-Bench 提供了100万条结构化条目覆盖指令遵循、事实一致性等四维奖励,为智能体推荐系统提供基础。SDAR(美团)用门控辅助目标稳定OPSD蒸馏,在ALFWorld、Search-QA等基准上相对GRPO提升7-10%。差异在于——PGR侧重检索前的前瞻推理,SDAR侧重训练中的稳定性,但共同挑战是LLM在推荐场景中的记忆与推理能力仍远未成熟。 主线 3“系统协同设计成为工业落地关键”: Meta的 LoKA 通过Probe-Mods-Dispatch三件套在FP8下实现训练吞吐+20%、推理加速+40%且无质量损失。Xiaohongshu的 CCD-Level Thread Orchestration 利用CCD架构的缓存特性,在ANNS服务上取得3.7x吞吐提升和30-90% P999延迟降低。Baidu的 Efficient Generative Targeting 结合量化、稀疏化和并行验证,实现1.8倍推理加速并部署于广告系统。这些工作表明——模型架构改进的边际效应递减时,硬件感知的系统优化正成为实际收益的主要来源。

推荐算法日报 - 2026-05-16

生成式检索进入工业深水区:今日多篇论文(阿里、腾讯、美团)聚焦生成式推荐(GenRec)的工业落地。核心挑战从“如何生成语义ID”转向“如何解决信息瓶颈、对齐下游排序目标、实现端到端训练”。CQ-SID、AsymRec、DIG等方案分别从非对称表示、Tokenizer端到端训练、强化学习对齐等角度切入,标志着GenRec正从概念验证走向大规模生产部署。; 强化学习与知识蒸馏成为LLM后训练标配:多篇论文(美团、蚂蚁)探索如何利用RL(GRPO、双层优化)和自蒸馏(SDAR、Length-Regu

推荐算法日报 - 2026-05-15

生成式推荐的工程化加速:今日多篇论文聚焦于生成式推荐(Generative Recommendation)的落地瓶颈——推理延迟。Snap与UCSD提出的SID-MLP通过MLP蒸馏替代Transformer解码器,实现8.74x加速且精度持平;另一篇工作F-GRPO则从强化学习角度统一生成与排序,解决端到端优化中的信用分配问题。这表明业界正从“模型能力”转向“系统效率”,探索如何让生成式推荐在工业级延迟约束下真正跑起来。; 探索策略的精细化与实用化:Google DeepMind提出的Deli

推荐算法日报 - 2026-05-14

[LLM Agent 与推荐系统深度融合]:今日多篇论文聚焦于将LLM Agent的能力引入推荐系统,从简单的序列匹配转向交互式、推理驱动的推荐。TwiSTAR通过自适应推理分配(快慢思考)和工具调用(检索、排序、推理)来提升生成式推荐的精度与效率;RecRM-Bench则系统性地定义了Agent推荐系统的多维奖励建模(指令遵循、事实一致性、相关性、行为预测),为RL优化提供了标准化基准。这表明,将LLM的规划、推理和工具使用能力融入推荐全链路是当前的重要趋势。; [推荐系统中的偏差识别与去偏方

推荐算法日报 - 2026-05-13

[LLM与推荐系统的深度融合]:今日多篇论文聚焦于将LLM能力注入推荐系统,从生成式推荐(LASAR)、多模态理解(ByteDance框架)到个性化知识发现(PDR)和组推荐(AgentGR),LLM正从辅助工具演变为推荐核心引擎。趋势在于利用LLM的推理和语义理解能力,解决传统模型在细粒度偏好建模、复杂决策模拟和内容理解上的瓶颈。; [系统-模型协同优化成为主流]:Meta的LoKA和Xiaohongshu的CCD-Level框架表明,单纯优化模型或系统已无法满足大规模部署需求。LoKA通过F

推荐算法日报 - 2026-05-12

LLM 驱动推荐系统进入精细化阶段:今日多篇论文聚焦如何更高效、更精准地将LLM融入推荐流程。从利用LLM生成可解释的用户画像(BLUE),到用强化学习(GRPO)优化检索策略(RRCM),再到双通道解耦语义与行为(DCGL),趋势已从“能否用LLM”转向“如何用好LLM”,尤其关注稀疏场景和跨域泛化。; 对现有基准评估体系的反思与重构:多篇论文揭示了当前推荐基准的局限性。Meta的论文通过简单图启发式方法,指出许多基准存在“捷径可解性”,模型的高分可能并非源于其声称的复杂能力。同时,TRACE

推荐周报 2026-W19

本周 22 篇论文里能看出两条主线:生成式推荐继续在 Semantic ID 这一层做深耕,检索 / agentic search 这条线则在重写检索接口本身。另有三篇围绕 RAG 工程化(合成表格扩散、自动化 RAG 管线、生产级数据层),列入论文速览的"其他"部分。 生成式推荐侧四篇论文把更多结构化信号——商业价值、地理坐标、协同信号、长尾边界——直接压进 Semantic ID 这一层。腾讯(微信视频号广告)的 UniVA 做到 SID/decoding/serving 三段同时注入 eCPM 信号,离线 Hit Rate@100 +37.04%、线上 A/B GMV +1.5%;UCSD × Snap 的 Latte 从理论上证明自回归 SID 解码树会把语义近的 item 强行拉到一起,再给出在 token 前缀挂 latent 的低成本修补,NDCG@10 +3.45%。 检索侧的故事更激进。一周之内出现三种"重写检索接口"的反命题:Meta Superintelligence Labs 的 SIRA 把多轮 agent 探索压成一次 LLM-corpus 双向扩展的 BM25;Texas A&M / Stanford / UWashington 等 19 作者的 DCI 直接删掉 retriever,让 Claude Sonnet 4.6 用 grep + bash 在原始语料上调查(BrowseComp-Plus accuracy 从 69.0% 升到 80.0%、API 成本降 29.4%);UC Berkeley 的 T3 把 RAG 的"corpus"从文档换成 LLM 思维轨迹,AIME 上给 Gemini-2.5-Flash 注水 +56.3%。MIT 同期放出 OBLIQ-Bench,把"为什么必须改接口"这件事量化——传统 BM25 / dense / late interaction 在隐含意图查询上几乎全部接近 0 NDCG@10。 工业精排和召回侧维持"先拆瓶颈、再谈结构"的节奏。Meta Ads 的 IEFF 把特征下线从 3-6 个月重训压到不需重训,效率类 rollout 提速 5×;阿里淘天的 RecGPT-Mobile 把 next-query LLM 搬到手机端;中科大 × 美团的 DynamicPO 揭示多负样本 DPO 的"偏好优化坍塌"现象并给出梯度抑制的理论解释。整体趋势是:算法侧追求"动态自适应目标",工程侧追求"可回滚的弹性接口"。

推荐算法日报 - 2026-05-09

生成式推荐进入工业深水区:今日多篇论文(腾讯UniVA、Snap Latte)聚焦生成式推荐在工业场景的落地挑战。核心矛盾从“如何生成”转向“如何对齐商业价值”和“如何突破表达能力瓶颈”。UniVA提出全链路价值对齐框架,Latte则从理论层面揭示自回归语义ID的结构性限制,标志着该领域从概念验证走向工程优化。; 智能体(Agent)重塑搜索与推荐范式:Meta的SIRA和Waterloo的DCI分别从“单次检索替代多轮探索”和“用grep替代向量检索”两个角度,重新定义了检索接口。ByteDa

推荐算法日报 - 2026-05-08

LLM推荐走向端侧与列表级优化:今日两篇论文分别从端侧部署(RecGPT-Mobile)和列表级对齐(BLADE)两个方向推进LLM在推荐系统中的应用。前者解决端侧推理成本与实时性,后者突破静态对齐的性能上限,共同指向LLM推荐从“能用”到“高效、精准”的落地路径。; 生成式推荐进入“软路由”时代:CapsID用胶囊路由替代传统硬量化,解决了语义ID生成中的边界坍塌和误差传播问题,在35M级工业数据集上召回提升9.6%。这标志着生成式推荐的核心瓶颈从模型架构转向了tokenizer设计,软路由+

推荐算法日报 - 2026-05-07

生成式检索与RAG的工业化落地:今日多篇论文聚焦于将生成式范式(如LLM)应用于检索系统,从GenPOI的生成式POI检索到AutoRAGTuner的RAG管线自动化,再到利用思考轨迹(Thinking Traces)作为RAG语料库,表明业界正积极探索用生成式模型替代或增强传统检索流程,以解决复杂查询和上下文建模问题。; 从“检索”到“系统”的全链路优化:工业界论文(如Walmart的Unified Data Layer、Ant Group的AutoRAGTuner)不再局限于单一算法模块,而

推荐算法日报 - 2026-05-06

频域分析与序列建模融合:今日多篇论文探索了在频域(FEDIN)或连续时间域(BST-CDSR)建模用户行为,以捕捉传统时序方法难以处理的周期性模式和兴趣衰减,为序列推荐提供了新的信号增强思路。; LLM 从“生成”走向“评估与攻击”:LLM 的应用场景从内容生成扩展到模型评估与安全测试。CRAFT 利用 LLM 生成对抗样本来攻击排序模型,而 BST-CDSR 则利用 LLM 提取时间语义,展示了 LLM 在推荐系统攻防与特征工程中的潜力。; ⚖️ 公平性与评估稳定性成为焦点:工业界和学术界均开

推荐算法日报 - 2026-05-05

工业级系统优化与效率提升:今日多篇工业界论文(Meta、IKEA)聚焦于在不牺牲模型效果的前提下,通过系统级创新(如IEFF的弹性特征衰减)或训练数据优化(如IKEA的结构化负采样)来提升大规模推荐系统的迭代效率和资源利用率。这反映了工业界从追求模型复杂度转向关注工程效率与落地可行性的趋势。; LLM与推荐系统的深度融合与挑战:多篇论文(DynamicPO、IKEA、RIR综述)探讨了LLM在推荐系统中的应用,但同时也揭示了新的挑战,如偏好优化崩溃、零点击行为对线上效果的制约,以及LLM作为信息