日报

技术趋势

今日 AI 领域聚焦效率革命与 Agent 工程深化：vLLM 团队将 Qwen3-Omni 实时语音推理延迟降至 0.6s、吞吐提升 5.4 倍，标志多模态推理走向实用；Anthropic 与三星洽谈定制 AI 芯片，AI 巨头加速硬件自研；NVIDIA 推出 GPU 收入分成计划，降低初创公司算力门槛。同时，ZCode 以免费策略挑战 Cursor 和 Claude Code，Adobe 展示 'Agentic Site' 概念，预示 Agent 驱动 Web 体验的新范式。学术界方面，蚂蚁集团发布 Vera 框架系统性测试 LLM Agent 安全，Microsoft 推出首个 Offi

文章详情

推荐系统

日报

LLM 深度赋能召回与检索：今日多篇论文将大语言模型（LLM）应用于推荐系统的召回阶段，超越了传统的语义匹配。Meta 利用 LLM 聚类生成硬负样本，Baidu 则用 LLM 构建用户画像并优化记忆检索，Amazon 则通过词汇迁移解决现代编码器在稀疏检索中的“词汇鸿沟”问题。这表明 LLM 正从特征提取向核心检索逻辑演进。; 生成式重排与推理加速成为焦点：以 Diffusion-GR2 为代表的生成式重排器，通过链式推理（CoT）提升排序精度，但其自回归解码速度是部署瓶颈。将扩散模型与知识蒸

文章详情

日报

技术趋势

今日 AI 领域迎来多项重要发布：Apple 在 Safari 中推出官方 MCP Server，成为主流浏览器首次原生支持 MCP 协议，标志着生态从开发者工具向消费级应用扩展。字节跳动发布 Seed2.0 模型系列，聚焦长尾知识与复杂指令跟随，服务数亿用户。NVIDIA 开源 Nemotron-Labs-TwoTower 扩散 LLM 架构，实现 2.42 倍吞吐量。同时，苹果研究挑战多 Agent 主流设计，发现自组织团队表现反而不如单一 Agent，为 Agent 团队设计提供反直觉指导。Palo Alto Networks 揭示“Phantom Squatting”新威胁——LLM

文章详情

推荐系统

日报

生成式推荐全面渗透推荐全链路：今日多篇重磅论文（Netflix GenPage、GR2、ShopX）共同指向一个趋势：生成式推荐正从传统的候选生成阶段，向精排、重排乃至整个主页构建等全链路环节渗透。核心思路是用一个统一的Transformer/LLM模型，通过自回归或语义ID（SID）的方式，端到端地完成排序、布局生成等任务，替代传统的多阶段流水线。; 强化学习（RL）+ 推理蒸馏成为LLM落地的关键配方：GR2和GenPage都验证了RL在LLM推荐中的巨大潜力，尤其是在重排序和页面生成这类复

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑事件：Anthropic 前沿模型 Fable 5 和 Mythos 5 在出口管制解除后全球重新上线，标志美国 AI 监管从激进限制转向有条件开放。MCP 协议宣布 7 月 28 日转向无状态，所有生产部署团队需紧急适配。Meta 公开 AI 存储架构演进，揭示传统 BLOB 延迟瓶颈导致 GPU stall 的核心挑战。同时，Together AI 完成 8 亿美元 C 轮融资，估值 83 亿；Kling AI 生成的广告片在戛纳电影节获奖；Boston Dynamics 的 Spot 机器人部署于 2026 世界杯安保。AI 正从聊天机器人时代走向自主工作时

文章详情

推荐系统

日报

实时序列建模与多阶段信号融合：工业界（快手）开始利用精排阶段的多任务分数（CTR、观看时长）作为监督信号，构建动态偏序序列，替代传统的静态点击序列。这标志着序列建模从“被动记录”向“主动利用排序信号”的转变，能更精准地捕捉用户实时意图变化，并直接优化业务核心指标（如观看时长）。; 检索范式从“匹配”到“导航”的进化：无论是快手提出的IID-Nav（图导航）还是学术界对RAG检索瓶颈的诊断，都表明传统的静态相似度匹配（i2i）已无法满足复杂场景需求。新的趋势是将检索建模为状态化、多步的自主探索过程

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布：Anthropic 发布 Claude Sonnet 5，性能逼近 Opus 4.8 但价格更低，同时推出面向科学家的 Claude Science 工作台。Amazon 成立 10 亿美元 FDE 组织押注 Agent 现场部署，X 推出官方 MCP Server 扩展生态。微软连发 Memora 记忆系统和 SkillOpt 技能优化两项 Agent 架构突破，NVIDIA 通过软件优化使 DeepSeek V4 在 Blackwell 上月内性能提升 5 倍。Figure 人形机器人 F.03 已抵达宝马工厂，Jim Fan 发布 ASPIRE 机器人技

文章详情

推荐系统

日报

[LLM 推荐进入"推理"深水区]：今日两篇论文（IntuRec、期刊推荐）均利用 LLM 进行偏好推理，但不再满足于简单的 prompt 匹配。IntuRec 引入认知科学中的"直觉"概念，用候选集引导 LLM 在连续隐空间进行多步推理，而非直接输出 token。这标志着 LLM 推荐正从"语义匹配"向"结构化推理"演进，工业落地需关注推理延迟与成本。; [重排/排序的可解释性与约束优化并重]：KakaoBank 的 ChunkGroupSHAP 解决了密集嵌入排序的特征粒度不匹配问题，Avi

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅动态：美团 LongCat 的 Owl Alpha 1.6T MoE 模型登顶 OpenRouter，完全基于 50k 中国 ASIC 训练，标志着国产算力生态的里程碑式突破。同时，阶跃星辰 Step 3.7 Flash 在自主 Agent 评测中排名第二，MiniMax M3 428B 在三台 Mac 上本地运行并自主创建股票组合，中国 AI 力量全面崛起。工具生态方面，Cursor 发布 iOS 应用、vLLM 深度优化 TTS 模型、LlamaParse 推出 Retrieval Harness，Agent 开发正从桌面走向移动端和生产级。学界方面，上海 AI

文章详情

日报

技术趋势

今日 AI 领域迎来多项重磅进展：DeepSeek V4 发布 DSpark 推测解码框架，推理速度提升 80% 并全栈开源；SubQ 模型以 56 倍注意力加速挑战长上下文瓶颈；Grok 4.5 进入 SpaceX/Tesla 私有测试，GLM-5.2 以 1/6 成本击败 GPT-5.5 引发企业后训练热潮。苹果 Xcode 26.3 原生集成 Agentic Coding，微软 73 亿美元 Fairwater AI 园区启用，AI 基础设施与开发工具正全面走向生产级。

文章详情

推荐系统

日报

[Agent + LLM 驱动推荐系统自动化]：从架构演化到特征筛选，工业界正系统性地引入 LLM Agent 来替代人工专家。腾讯的 NOVA 框架展示了 Agent 如何自动化完成“论文到生产”的模型升级，PayPal 的 EMA-FS 则用增益感知的筛选策略加速 GBDT 训练。核心趋势是从“调参自动化”走向“架构决策自动化”，但验证和风险控制（如 NOVA 的验证级联）是落地的关键。; [归因与增量性：从“归因”到“归因校正”]：广告归因领域正从简单的“最后一次点击”或“多触点归因”转向

文章详情

日报

技术趋势

今日 AI 领域迎来里程碑式发布：OpenAI 正式预览 GPT-5.6 Sol，采用全新架构并支持 1M 上下文，但发布过程罕见地被美国政府干预，需商务部逐客户审批放行，标志着前沿模型监管进入新阶段。与此同时，智谱 AI 开源模型 GLM-5.2 在编码能力上首次超越 GPT-5.5，成本仅为其 1/6，开源社区迎来重要拐点。产业层面，Stripe 分享了年处理 1.4 万亿美元交易的生产级 Agent 架构，快手开源 AgentX 多智能体系统实现超 1 亿年化收入，AI 从能力展示正式进入规模化价值兑现期。

文章详情

1 2 3 4 5 6

...