AI 技术日报 - 2026-06-17

今日 AI 领域迎来历史性并购:SpaceX 以 600 亿美元全股票收购 Cursor,成为 2026 年最大创业公司并购案,同日 Cursor 推出 Origin 挑战 GitHub。微软据传正探索用 DeepSeek 替代 OpenAI/Anthropic 以控制 Copilot Cowork 成本,而智谱 GLM-5.2 以 51 分登顶 AI 智能指数,开源 MIT 许可。产业层面,AI 公司 CEO 首次受邀参加 G7 峰会午餐会,标志 AI 正式进入地缘政治核心议程。

推荐算法日报 - 2026-06-17

生成式推荐与多任务架构的深度融合:今日多篇论文(OneRank、OneBar、HoloRec)不约而同地将生成式或Transformer-native架构引入推荐核心环节,从精排到召回,试图用统一的生成式框架替代传统的多阶段级联设计,解决目标碎片化和信息瓶颈问题。; 挖掘被忽视的信号源:负行为与合成先验:工业界正积极从“数据”本身寻找增量。一方面,Beyond Positive Signals 论文系统性地将用户隐式负行为(跳过、低参与度)纳入序列建模,以极低成本带来显著AUC提升;另一方面,S

推荐算法日报 - 2026-06-16

检索增强与自适应优化:今日多篇论文聚焦于优化RAG系统的检索环节,核心趋势是从“固定K值”转向“自适应”。无论是ScoreGate通过双分数统计融合动态决定检索数量,还是ADORE通过迭代检索-评估-扩展优化查询,亦或是TASR提出无需训练的停止规则,都旨在以最小的额外成本(零推理调用或轻量规则)提升检索效率与质量,这对工业级RAG系统降低延迟和成本极具价值。; 生成式推荐的时序与语义融合:以ChronoID为代表,生成式推荐正从“时间无关”的语义ID学习,转向显式注入时间信号。这揭示了现有方法

AI 技术日报 - 2026-06-16

今日 AI 领域生态与工程齐头并进:Anthropic 新隐私政策引发争议,Sakana AI 推出 8 小时深度研究 Agent Marlin,vLLM v0.23.0 全面支持 DeepSeek-V4。OpenAI 投入 1.5 亿美元构建合作伙伴网络,目标培训 30 万认证顾问。AWS 发布 Agent 故障检测工具 Strands Evals Detector,同时 Kubernetes GPU 时间切片隐藏代价被揭示——多 Agent 共享 GPU 时 p99 延迟飙升 66%。论文方面,Microsoft 提出几何诊断方法揭示 LLM-as-Judge 的共享偏差,Amazon 推

AI 技术日报 - 2026-06-15

今日 AI 领域监管与效率两大主题交织:美国当局以安全为由暂停 Anthropic 最先进模型 Fable 5 和 Mythos 5 的访问,联合创始人 Andrej Karpathy 因非美国公民身份被拒接触内部模型,引发对"主权 AI"政策的广泛争议。与此同时,AMD 发布 Ryzen AI Max+ 395,以 128GB 共享内存和 1,499 美元售价实现本地运行 235B 模型,推理性能据称超 RTX 5080 三倍,标志着消费级硬件与云 AI 订阅的性价比拐点。产业层面,Mistral AI 以 200 亿欧元估值融资,欧洲主权 AI 从叙事走向现实;而 'Agentjackin

AI 技术日报 - 2026-06-14

今日 AI 领域地缘政治风险加剧:美国政府直接指令 Anthropic 暂停 Fable 5/Mythos 5 对外国用户访问,出口管制从地域转向个人身份,MiniMax 随即宣布 M3 开源并强硬回应。同时,GitHub 分享 Copilot CLI 委派优化实践,NVIDIA Blackwell 在首个 Agentic AI 基础设施基准 AgentPerf 中领跑,微软 Project Ire Agent 成功自主识别恶意软件变种,Agent 工程正从概念走向生产级精细优化。

AI周报 2026-W24

上周的核心叙事可以浓缩成三个字——“够用了”。Claude Fable 5 的发布将通用模型能力拉到新高度,同时定价砍半。但更重要的是,围绕 Agent 的评估、安全、记忆和推理优化,工业界的交付物开始从“论文概念”变成“可运行的代码和框架”。Anthropic 的预填撤回风波、Kimi Work 的 300 个本地并行 Agent、MiniMax 的稀疏注意力内核——这些事件共同指向一个信号:2026 年上半年的 AI 工程化,正在从“能不能跑”转向“能不能可靠地跑”。

推荐周报 2026-W24

本周推荐系统研究围绕三条技术主线展开:生成式推荐从架构完备走向工业级工程落地,其中编辑性、长序列建模、物品级评分等关键能力被逐一攻克;LLM增强的推荐从离线推理迈向在线实时,谷歌与快手等团队实现了十亿用户规模的实时用户画像与意图推理;召回排序系统的成本与效率优化出现系统性方案,小红书以90%硬件成本节省为代价将聚类ANNS部署至SSD存储,同时CTR模型的残差路径设计开始突破缩放定律瓶颈。 主线1(生成式检索工程化): 快手推出的OneRetrieval首次实现了可编辑的生成式检索,在替换倒排索引分支后显著提升订单量与CTR;Yandex的Gryphon引入联合训练的物品级评分组件,替换超过15个候选生成器与粗排阶段,召回量Recall@1000提升3.7%;京东的AdaGRPO通过自适应门控GRPO损失,将HR@10从11.01%提升至12.18%;Meta的Beyond Item IDs提出Global-Aware Compression Transformer,将峰值内存降低一个数量级;阿里的SSRLive通过动态语义ID融入用户-主播交互信号,线上观看时长+3.38%。 主线2(LLM推荐实时化): 谷歌的LLM-Based User Personas框架实现了十亿用户规模的实时自然语言用户画像生成,结合知识蒸馏与异步推理在线上A/B测试中显著提升用户价值;快手的AIR通过离线生成原子意图、在线检索组合的方式实现了400倍推理加速,GMV+3.446%;DoorDash的Mind the Gap利用分层RAG从餐厅订单中生成多级分类特征,在零售品类上CTR+2.1%;OPPO的ToolRec为小布助手(1.5亿月活)构建了双层级点击校准机制,CTR显著提升。 主线3(召回排序系统效率优化): 小红书的Helmsman在40台SSD服务器上替代了原需35000核与0.35PB DRAM的HNSW集群,硬件成本节省90%;DeRes通过双路径残差架构在工业CTR数据集上AUC+0.32%,且计算-AUC缩放定律显示8层DeRes匹配16层OneTrans(2倍计算节省);Meta的DUET将用户行为分离为点击与转化两个流,分别用专用Transformer预训练,离线NE降低0.38%;eBay的Representation Curriculum通过分阶段训练缓解曝光依赖信号,冷启动Recall+5.2%。

推荐算法日报 - 2026-06-13

生成式检索从概念走向工业落地:今日两篇高分论文均聚焦于用生成式模型统一或替代传统多阶段召回。快手的 OneRetrieval 首次在电商搜索中实现可编辑的生成式检索,统一多分支召回并显著提升订单量。这表明生成式检索正从学术概念向解决工业级“可编辑性”和“大规模部署”等核心痛点演进。; 向量检索系统架构向成本效率倾斜:小红书的 Helmsman 系统挑战了内存图索引(HNSW)的主导地位,通过构建基于全闪存服务器的聚类ANNS,结合用户态存储栈和GPU加速,将硬件成本降低90%。这揭示了在数据规模

AI 技术日报 - 2026-06-13

今日 AI 领域迎来多个重磅发布:MiniMax 开源 428B MoE 模型 M3,搭载自研稀疏注意力实现 1M 上下文 14 倍加速;Kimi 发布 K2.7-Code,编码 agent 能力提升超 30% 且推理 token 减少 30%。同时,Sapient 公司声称以约 1500 美元从零训练出 1B 基座模型 HRM-Text,直接挑战预训练 Scaling Law。MCP Dev Summit 2026 释放协议无状态化与 'Shadow MCP' 治理挑战等关键信号。产业层面,Q1 AI 融资 242B 美元中四大公司吸走 65%,资本集中度持续加剧。

推荐算法日报 - 2026-06-12

LLM 深度融入推荐系统全链路:今日多篇论文展示了 LLM 不再仅是辅助工具,而是直接参与推荐核心环节。从 Google 的实时用户画像生成(召回/排序特征),到 CompRank 的 LLM 重排序,再到 TAA-k 优化 RAG 上下文选择,LLM 正在渗透召回、排序、重排等各个阶段,且开始关注工业级部署的效率和成本问题。; 生成式模型成为解决推荐顽疾的新范式:DiffCold 使用扩散模型解决冷启动中的“跷跷板困境”,通过生成式方法统一冷热物品的表示空间。这表明生成式模型(扩散模型、LLM

AI 技术日报 - 2026-06-12

今日 AI 领域迎来多个重磅事件:Jeff Bezos 首次公开其 AI 创业公司 Prometheus,以 120 亿美元融资和 410 亿美元估值成为 2026 年最大 AI 融资事件。模型竞争格局突变,GPT-5.5 在全新 Agents' Last Exam 基准上意外击败 Claude Fable 5,而 Anthropic 因社区抗议撤回对 Claude Fable 5 的隐形限制政策。OpenAI 收购云编排公司 Ona 为 Codex Agent 构建持久化企业环境,AWS 发布 Agent-EvalKit 开源评估工具,Agent 基础设施正加速走向生产级。学术方面,阿里 Q