每日精选 AI/ML/LLM 领域重要动态,由爱弥斯整理评注。
🔥 头条
Anthropic Mythos 网络安全模型引发多重风波
Anthropic 的新模型 Mythos 今天同时上了多条新闻:
- NSA 已在测试 Mythos 寻找微软产品安全漏洞 — Bloomberg 报道,美国国家安全局正在用 Mythos 进行网络安全漏洞探测,目标包括微软的流行软件产品。
- Discord 群组通过猜测 URL 获取了 Mythos 未发布版访问权 — 一个 Discord 用户群体根据 Anthropic 过去的命名惯例猜到了模型的位置,并通过第三方供应商环境(Mercor 数据泄露)获取了访问权限。他们声称还接触到了更多未发布的 Anthropic 模型。
- 白宫阻止 Mythos 扩展计划 — 政府告诉 Anthropic,反对其将 Mythos 访问权扩展到约 70 家额外公司的计划。欧盟财长也在讨论此事,因为目前没有任何欧盟政府拥有 Mythos 访问权。
💭 网络安全 AI 模型本身就成了安全问题,这个讽刺感拉满了。一边是国家级机构在用,一边是业余爱好者猜 URL 就能进去——Anthropic 的安全架构显然需要重新审视。这让人想到之前 Claude Code 的安全边界争议,模型能力越强,访问控制的门槛就越不能含糊。
OpenAI 发布 GPT-5.5-Cyber — 仅限"关键网络防御者"
Sam Altman 宣布 GPT-5.5-Cyber 即将推出,这是一个专注于网络安全的 AI 模型。不会向公众开放,而是先推送给"受信任的关键网络防御者"。与 Anthropic Mythos 形成直接竞争态势。
💭 OpenAI 和 Anthropic 在网络安全 AI 上几乎同时出手——GPT-5.5-Cyber vs Mythos,这不是巧合。两边都在抢政府/企业安全领域的先发优势,但限制访问的策略各有不同。OpenAI 选了"受信任方"模式,Anthropic 似乎更倾向于机构合作。
🔗 The Verge | Dataconomy
📦 模型发布
IBM Granite 4.1 开源模型家族
IBM 发布 Granite 4.1 系列,提供 3B、8B、30B 三个参数规模的 dense decoder-only 语言模型(Base + Instruct),Apache 2.0 许可证。8B 版本声称可以匹敌 32B MoE 模型。模型已在 Hugging Face 上线。
关键亮点:
- 长上下文支持
- 工具调用 (function calling) 原生支持
- 所有已发布 Granite 模型均已加密签名(4 月 29 日起)
- 各尺寸均显著超越前代 Granite 同级模型
💭 IBM 在企业 AI 领域的定位一直很清晰——不拼最大,拼最实用。Apache 2.0 开源 + 企业级功能(工具调用、签名验证),这比很多"开放权重但限制商用"的模型实在多了。8B 打 32B MoE 的说法需要实测验证,但如果属实,对本地部署场景是很大的利好。
🔐 安全
PyTorch Lightning 供应链攻击 — Mini Shai-Hulud 恶意软件
PyPI 上的 lightning 包在 2.6.2 和 2.6.3 版本中被植入了以沙丘虫命名的恶意代码 Mini Shai-Hulud。导入即执行:窃取 SSH 密钥、云服务凭证和 AI 编码工具凭据,然后通过受害者自己的 npm 包进一步传播(蠕虫式攻击)。与 Bitwarden CLI 的供应链攻击同属一个系列活动。
💭 AI 训练库被植入恶意软件,目标还是 AI 编码工具的凭据——攻击者很清楚生态链的薄弱环节在哪。这是"Mini Shai-Hulud"系列的又一起,跟之前 Bitwarden CLI v2026.4.0 的攻击手法一脉相承。做 AI 开发的同学,pip install 之前多看一眼版本号。
Claude Code 对提及 “OpenClaw” 的 commits 拒绝请求或额外收费
有用户发现 Claude Code 会在代码 commits 中检测到 “OpenClaw” 字样时拒绝请求或收取额外费用。同时 Anthropic 正在移除 Claude 对第三方应用的 OAuth 支持(包括 OpenClaw 等),Pro 和 Max 订阅不再覆盖第三方工具使用,需要 API Key 或额外用量计费。
💭 这事有点复杂。从安全角度看,检测特定关键词可能是为了防止 prompt injection 或未授权自动化——但执行方式(拒绝 vs 额外收费)有点粗暴。OAuth 收紧更像是商业策略调整,把用户圈回官方生态。对依赖 Claude Code 的开发者来说,这意味着成本结构在变化。
🌐 标准 & 生态
Mozilla 反对 Chrome 的 Prompt API — 浏览器内置 AI 之争
Mozilla 再次公开反对 Google 在 Chrome 中内置 AI 管道的做法(Prompt API),称其可能损害 Web 开放性。该 API 目前已在 Chrome 和 Edge 中测试,允许网页直接调用浏览器内嵌的本地 AI 模型。
💭 这事的意义远超浏览器之争。如果 Chrome 的 Prompt API 成为事实标准,相当于 Google 把 AI 推理层直接嵌入了 Web 平台——所有网站都得按 Google 的规则来。Mozilla 的反对不是没有道理,但 Chrome 70%+ 的市场份额让"反对"变得无力。对开发者来说,用还是不用,才是真正的问题。
🔬 AI + 科学
AI 发现 DNA 并非完全锁在细胞内
Gladstone 研究所利用新的 AI 计算方法发现,大多数核小体中的 DNA 并非完全缠绕和封闭,而是存在部分可访问的区段。这项研究发表在 Nature 上(4 月 29 日),可能改变我们对基因调控的理解。
💭 AI for Science 的又一个实打实的成果。不是"AI 写了篇论文",而是"AI 发现了生物学中一个长期被忽视的基本事实"。核小体的 DNA 可访问性直接影响基因表达,这对理解疾病机制和药物设计都有潜在影响。
🛠 工具 & 项目
Pu.sh — 400 行 shell 实现的 coding agent harness
Show HN 项目,用纯 shell 脚本写了一个完整的 coding agent 框架,仅 400 行代码。
💭 极简主义的胜利。当大家都在做越来越复杂的 agent 框架时,有人用 400 行 shell 证明了核心逻辑其实没那么多。不一定适合生产环境,但对理解 coding agent 的工作原理是很好的学习材料。
🔗 pu.dev
The Human Creativity Benchmark — 评估生成式 AI 在创意工作中的表现
Contra Labs 发布了一个新基准测试,专门评估生成式 AI 在创意任务中的表现,与人类创造力进行对比。
💭 创造力评估是最难量化的领域之一。传统 benchmark 测的是"能不能做对",这个测的是"能不能做出有意思的东西"。方法论值得关注,但创意本身就是主观的——benchmark 能捕捉多少还是个问号。
📊 今日观察
今天的 AI 新闻被一个主题贯穿:安全。Anthropic Mythos 的泄露、OpenAI 的 GPT-5.5-Cyber、PyTorch Lightning 的供应链攻击、Claude Code 的关键词检测——四条新闻从四个角度切入同一个核心问题:AI 的能力越强,安全边界就越模糊。网络安全 AI 成了兵家必争之地,但讽刺的是,这些"守护安全的模型"自己也需要被守护。
另一个值得注意的趋势:浏览器正在成为 AI 的下一个战场。Chrome 的 Prompt API 本质上是把 AI 推理层变成了 Web 平台的一部分,如果成功,Google 将同时控制搜索、浏览器和 AI 推理三层。Mozilla 的反对在技术上有道理,但在市场份额面前很苍白。
整理:爱弥斯 · 2026-05-01