🔥 头条
Anthropic 与 SpaceX 达成算力合作,Claude Code 速率翻倍
Anthropic 宣布与 SpaceX 达成合作协议,将使用 SpaceX 位于 Colossus 1 数据中心的"全部算力容量",预计当月新增超过 300MW 算力。受此推动,Anthropic 将 Claude Code 的 Pro 和 Max 订阅五小时窗口限额翻倍,并取消了高峰时段的限额削减。这是 Anthropic 近期一系列算力交易中最大的一笔,也意味着 Claude Code 用户的开发体验将显著改善。
🔗 Anthropic 官方公告 | Ars Technica 报道
OpenAI 发布 GPT-5.5 Instant,取代 GPT-5.3 Instant 成为 ChatGPT 默认模型
OpenAI 于 5 月 5 日正式发布 GPT-5.5 Instant 基础模型,即日起替代 GPT-5.3 Instant 成为 ChatGPT 的默认模型,同时通过 API 以 chat-latest 标识提供。新模型在速度和智能水平上均有提升,标志着 OpenAI 的快速迭代节奏仍在持续。
🔗 OpenAI 官方 | TechCrunch
📰 行业动态
Google Chrome 静默安装 4GB Gemini Nano 模型,引发隐私风暴
隐私研究者发现 Google Chrome 会在用户设备上静默下载约 4GB 的 Gemini Nano 端侧 LLM 权重文件(weights.bin),无需用户同意也无任何通知。即使用户手动删除,文件也会在下次启动时重新下载。以 Chrome 十亿级装机量计算,此举的环境和带宽成本令人担忧。Malwarebytes 和 Cybernews 均对此进行了报道。
🔗 That Privacy Guy 原文 | Malwarebytes
微软叫停 Xbox Copilot AI 开发,新 CEO 大幅调整战略
Xbox 新任 CEO Asha Sharma 宣布停止 Xbox 主机端 Copilot AI 助手的开发,称将"退休与我们方向不符的功能"。这是微软 AI 战略的一次重要收缩,表明并非所有 AI 功能都能找到合适的产品场景。
🔗 The Register | Polygon
Cloudflare 联合 Stripe 让 AI Agent 自主开户、买域名、部署应用
Cloudflare 宣布 AI Agent 现可自主创建 Cloudflare 账户、通过 Stripe 支付、注册域名并获取 API Token 部署代码。这是 AI Agent 走向"自主运维"的标志性一步——从被动工具到能独立完成基础设施搭建的执行者。
Telus 使用 AI 实时修改客服口音,引发伦理争议
加拿大电信巨头 Telus 旗下 Telus Digital 部署了 AI 工具,实时调整海外客服的口音以"减少口音摩擦"。虽然公司声称是为了提升通话清晰度,但此举被广泛批评为文化抹除和歧视。
🔬 研究前沿
Apple 机器学习研究:LaDiR — 潜扩散增强 LLM 文本推理
Apple 与 UC San Diego 联合发表 LaDiR(Latent Diffusion Reasoner),将连续潜表示与潜扩散模型的迭代精炼能力结合,让 LLM 在回答前可以在隐空间中并行探索多条推理路径。实验表明 LaDiR 在准确性、多样性和可解释性上均优于现有自回归和扩散推理方法,开辟了文本推理的新范式。
🔗 Apple ML Research | OpenReview
潜积分扩散模型:理解 Flow Matching 的新视角
Sander Dieleman 发表博文探讨扩散模型积分的新理解方式,为 Flow Matching 和连续归一化流提供了更直观的数学框架,对生成模型领域的研究者有重要参考价值。
🔗 原文
🛠 开源 & 工具
Tilde.run — 面向 AI Agent 的沙箱与事务性版本文件系统
Tilde.run 提供隔离沙箱环境,将 GitHub 代码、S3 数据、Drive 文档统一为单一版本化文件系统,所有出站调用经检查和日志记录,让自主 Agent 安全地操作生产数据。HN 上获得积极反响。
Airbyte Agents — 为 AI Agent 提供跨数据源的上下文层
Airbyte 推出 Airbyte Agents,预复制和索引企业数据到托管 Context Store,解决 AI Agent 在企业部署中面临的数据碎片化问题。支持 Slack、Salesforce、Linear 等多种数据源的统一接入。
🔗 HN
Qwen 3.6 + MTP 推理加速实践
社区持续探索 Qwen 3.6 系列的推理优化:27B 模型通过 MTP(Multi-Token Prediction)投机解码可实现 2.5 倍吞吐提升;NVFP4 + MTP 组合在单张 RTX 5090 上可跑 200K 上下文;Unsloth UD 量化方案也在持续完善。
🔗 Qwen3.6-27B HuggingFace | Reddit 讨论
其他值得关注的开源项目
- tensorzero/tensorzero — LLM 应用优化网关,支持多模型路由和 A/B 实验
- langchain-ai/open-swe — LangChain 出品的开源软件工程 Agent
- unslothai/unsloth — LLM 微调加速框架,持续更新中
- Hmbown/DeepSeek-TUI — DeepSeek 终端 UI 客户端
- lucidrains/h-net-dynamic-chunking — H-Net 动态分块架构实现
💬 观点 & 评论
Simon Willison:Vibe Coding 和 Agentic Engineering 的边界正在模糊
Simon Willison 发文探讨 Vibe Coding(氛围编码)和 Agentic Engineering(智能体工程)之间日益模糊的界限。随着 AI 编程工具从"辅助"走向"自主",开发者需要重新思考人与 AI 在代码生产中的角色分工。HN 热度 354。
🔗 原文
“人人都有 AI,公司仍然什么都没学到”
Robert Glaser 的文章指出,尽管 AI 工具在组织中越来越普及,但知识并没有因此流动起来。工具 ≠ 学习,如果缺乏有效的知识管理机制,AI 只会让信息碎片化更严重。HN 热度 375。
🔗 原文
数据来源:Hacker News · GitHub Trending · Reddit (r/LocalLLaMA, r/artificial, r/MachineLearning) · TechCrunch 生成时间:2026-05-07 00:15 UTC
Photo by boris misevic on Unsplash