今日收录 12 篇文章,精选 6 篇,另有 14 条 KOL 推文,覆盖 MarkTechPost、simonwillison、aws、amazon、mit、Towards Data Science、ai-news、openai blog 等来源。
文章从零实现了集中式FedAvg和去中心化Gossip两种联邦学习架构,并集成了客户端差分隐私,在非独立同分布的MNIST数据上进行了系统性实验。核心发现揭示了隐私预算(epsilon值)对模型性能的复杂影响:去中心化架构在强隐私约束下表现更稳健,但收敛速度较慢;而集中式架构在弱隐私下收敛更快,但对噪声更敏感。实验量化了隐私保证与学习效率之间的权衡关系。
今日收录 2 篇文章,精选 0 篇,另有 17 条 KOL 推文,覆盖 Simon Willison、Towards Data Science 等来源。
今日收录 19 篇文章,精选 14 篇,另有 16 条 KOL 推文,覆盖 nesbitt、MarkTechPost、aws、simonwillison、Towards Data Science、ai-news、mit 等来源。
文章深入剖析了Zig等新兴编程语言在包管理器生态中面临的“M×N”集成难题:每个新语言都需要重建一整套工具链(如漏洞扫描、SBOM生成器),导致巨大的重复劳动。作者提出“依赖生命周期协议”(DLP)作为解决方案,类似于语言服务器协议(LSP),旨在标准化依赖管理的接口。文章还系统性地分析了社区、供应商和标准机构(如PURL、CRA)在解决这一生态系统挑战中的角色,并将技术问题与更广泛的数字主权议题
文章深刻剖析了数字主权中常被忽视的“依赖层”问题,指出欧洲不应简单重复建设类似AWS的基础设施,而应通过制定和推广开放标准(如S3 API)来降低技术切换成本。核心发现是,即使代码自托管,欧洲公司仍严重依赖美国主导的软件供应链服务,如代码托管(GitHub)、依赖智能(Dependabot)和包注册表(npm)。文章提出通过标准化协议(如PURL、OSV、CycloneDX)解耦包管理器组件,并建
DSGym 是一个由斯坦福大学、Together AI 等机构提出的框架,用于标准化地评估和训练数据科学 Agent。它通过容器化环境封装了超过 1,000 个数据科学挑战,并引入了 DSBio(生物信息学)和 DSPredict(Kaggle 预测)等新数据集。评估发现,前沿模型在一般分析任务上表现良好(60%-90%准确率),但在 DSBio 上因“领域接地错误”而性能骤降(最佳仅 43.33
本文是对 GPT-OSS 模型实施 Agentic RL 训练的深度实战回顾。文章详细拆解了训练过程中遇到的核心挑战,包括修复 PPO 算法中 MoE 专家对数概率不匹配的问题、纠正训练与推理阶段的不一致性。在性能优化方面,作者分享了如何集成 FlashAttentionV3 的注意力下沉支持,并利用 FSDP 内存优化与序列并行技术来提升训练效率。
文章提出了一个开创性的概念“PkgFed”,旨在利用去中心化社交网络协议ActivityPub来构建联邦化的软件包发布生态系统。其核心是将包注册表映射为Mastodon实例、软件包映射为Actor、版本发布映射为Post,从而使传统的单向依赖关系转变为可双向查看和探索的社交图谱。这一设计能极大增强维护者对其用户基础的可见性,改进安全漏洞通知的传播效率,并促进跨Forgejo等联邦化代码托管平台的软
今日收录 6 篇文章,精选 4 篇,另有 54 条 KOL 推文,覆盖 sebastianraschka、Towards Data Science、nesbitt、MarkTechPost、simonwillison 等来源。
今日收录 10 篇文章,精选 9 篇,另有 11 条 KOL 推文,覆盖 simonwillison、aws、MarkTechPost、Towards Data Science、ai-news、openai blog 等来源。
文章提出一个用于包管理的抽象协议参考模型,旨在统一描述npm、Cargo、pip等不同生态系统的共享概念,而非强制标准化。它定义了包管理的分层结构(用户命令、清单格式、注册表协议等)、关键角色(发布者、消费者)、数据类型(包标识符、版本约束)和核心操作(发布、解析、安装)。特别强调了常被忽视的治理操作(如命名空间分配)和一致性属性(解析确定性、锁文件完整性),并探讨了该协议如何促进便携安全研究、系