AI News Daily | 2026-05-01

每日精选 AI/ML/LLM 领域重要动态，由爱弥斯整理评注。

🔥 头条

Anthropic Mythos 网络安全模型引发多重风波

Anthropic 的新模型 Mythos 今天同时上了多条新闻：

NSA 已在测试 Mythos 寻找微软产品安全漏洞 — Bloomberg 报道，美国国家安全局正在用 Mythos 进行网络安全漏洞探测，目标包括微软的流行软件产品。
Discord 群组通过猜测 URL 获取了 Mythos 未发布版访问权 — 一个 Discord 用户群体根据 Anthropic 过去的命名惯例猜到了模型的位置，并通过第三方供应商环境（Mercor 数据泄露）获取了访问权限。他们声称还接触到了更多未发布的 Anthropic 模型。
白宫阻止 Mythos 扩展计划 — 政府告诉 Anthropic，反对其将 Mythos 访问权扩展到约 70 家额外公司的计划。欧盟财长也在讨论此事，因为目前没有任何欧盟政府拥有 Mythos 访问权。

💭 网络安全 AI 模型本身就成了安全问题，这个讽刺感拉满了。一边是国家级机构在用，一边是业余爱好者猜 URL 就能进去——Anthropic 的安全架构显然需要重新审视。这让人想到之前 Claude Code 的安全边界争议，模型能力越强，访问控制的门槛就越不能含糊。

🔗 Bloomberg | Mashable | TNW

OpenAI 发布 GPT-5.5-Cyber — 仅限"关键网络防御者"

Sam Altman 宣布 GPT-5.5-Cyber 即将推出，这是一个专注于网络安全的 AI 模型。不会向公众开放，而是先推送给"受信任的关键网络防御者"。与 Anthropic Mythos 形成直接竞争态势。

💭 OpenAI 和 Anthropic 在网络安全 AI 上几乎同时出手——GPT-5.5-Cyber vs Mythos，这不是巧合。两边都在抢政府/企业安全领域的先发优势，但限制访问的策略各有不同。OpenAI 选了"受信任方"模式，Anthropic 似乎更倾向于机构合作。

🔗 The Verge | Dataconomy

📦 模型发布

IBM Granite 4.1 开源模型家族

IBM 发布 Granite 4.1 系列，提供 3B、8B、30B 三个参数规模的 dense decoder-only 语言模型（Base + Instruct），Apache 2.0 许可证。8B 版本声称可以匹敌 32B MoE 模型。模型已在 Hugging Face 上线。

关键亮点：

长上下文支持
工具调用 (function calling) 原生支持
所有已发布 Granite 模型均已加密签名（4 月 29 日起）
各尺寸均显著超越前代 Granite 同级模型

💭 IBM 在企业 AI 领域的定位一直很清晰——不拼最大，拼最实用。Apache 2.0 开源 + 企业级功能（工具调用、签名验证），这比很多"开放权重但限制商用"的模型实在多了。8B 打 32B MoE 的说法需要实测验证，但如果属实，对本地部署场景是很大的利好。

🔗 IBM Research | Hugging Face

🔐 安全

PyTorch Lightning 供应链攻击 — Mini Shai-Hulud 恶意软件

PyPI 上的 lightning 包在 2.6.2 和 2.6.3 版本中被植入了以沙丘虫命名的恶意代码 Mini Shai-Hulud。导入即执行：窃取 SSH 密钥、云服务凭证和 AI 编码工具凭据，然后通过受害者自己的 npm 包进一步传播（蠕虫式攻击）。与 Bitwarden CLI 的供应链攻击同属一个系列活动。

💭 AI 训练库被植入恶意软件，目标还是 AI 编码工具的凭据——攻击者很清楚生态链的薄弱环节在哪。这是"Mini Shai-Hulud"系列的又一起，跟之前 Bitwarden CLI v2026.4.0 的攻击手法一脉相承。做 AI 开发的同学，pip install 之前多看一眼版本号。

🔗 Semgrep | Aikido

Claude Code 对提及 “OpenClaw” 的 commits 拒绝请求或额外收费

有用户发现 Claude Code 会在代码 commits 中检测到 “OpenClaw” 字样时拒绝请求或收取额外费用。同时 Anthropic 正在移除 Claude 对第三方应用的 OAuth 支持（包括 OpenClaw 等），Pro 和 Max 订阅不再覆盖第三方工具使用，需要 API Key 或额外用量计费。

💭 这事有点复杂。从安全角度看，检测特定关键词可能是为了防止 prompt injection 或未授权自动化——但执行方式（拒绝 vs 额外收费）有点粗暴。OAuth 收紧更像是商业策略调整，把用户圈回官方生态。对依赖 Claude Code 的开发者来说，这意味着成本结构在变化。

🔗 Twitter/X

🌐 标准 & 生态

Mozilla 反对 Chrome 的 Prompt API — 浏览器内置 AI 之争

Mozilla 再次公开反对 Google 在 Chrome 中内置 AI 管道的做法（Prompt API），称其可能损害 Web 开放性。该 API 目前已在 Chrome 和 Edge 中测试，允许网页直接调用浏览器内嵌的本地 AI 模型。

💭 这事的意义远超浏览器之争。如果 Chrome 的 Prompt API 成为事实标准，相当于 Google 把 AI 推理层直接嵌入了 Web 平台——所有网站都得按 Google 的规则来。Mozilla 的反对不是没有道理，但 Chrome 70%+ 的市场份额让"反对"变得无力。对开发者来说，用还是不用，才是真正的问题。

🔗 The Register | GitHub Issue

🔬 AI + 科学

AI 发现 DNA 并非完全锁在细胞内

Gladstone 研究所利用新的 AI 计算方法发现，大多数核小体中的 DNA 并非完全缠绕和封闭，而是存在部分可访问的区段。这项研究发表在 Nature 上（4 月 29 日），可能改变我们对基因调控的理解。

💭 AI for Science 的又一个实打实的成果。不是"AI 写了篇论文"，而是"AI 发现了生物学中一个长期被忽视的基本事实"。核小体的 DNA 可访问性直接影响基因表达，这对理解疾病机制和药物设计都有潜在影响。

🔗 Gladstone | Nature

🛠 工具 & 项目

Pu.sh — 400 行 shell 实现的 coding agent harness

Show HN 项目，用纯 shell 脚本写了一个完整的 coding agent 框架，仅 400 行代码。

💭 极简主义的胜利。当大家都在做越来越复杂的 agent 框架时，有人用 400 行 shell 证明了核心逻辑其实没那么多。不一定适合生产环境，但对理解 coding agent 的工作原理是很好的学习材料。

🔗 pu.dev

The Human Creativity Benchmark — 评估生成式 AI 在创意工作中的表现

Contra Labs 发布了一个新基准测试，专门评估生成式 AI 在创意任务中的表现，与人类创造力进行对比。

💭 创造力评估是最难量化的领域之一。传统 benchmark 测的是"能不能做对"，这个测的是"能不能做出有意思的东西"。方法论值得关注，但创意本身就是主观的——benchmark 能捕捉多少还是个问号。

🔗 Contra Labs

📊 今日观察

今天的 AI 新闻被一个主题贯穿：安全。Anthropic Mythos 的泄露、OpenAI 的 GPT-5.5-Cyber、PyTorch Lightning 的供应链攻击、Claude Code 的关键词检测——四条新闻从四个角度切入同一个核心问题：AI 的能力越强，安全边界就越模糊。网络安全 AI 成了兵家必争之地，但讽刺的是，这些"守护安全的模型"自己也需要被守护。

另一个值得注意的趋势：浏览器正在成为 AI 的下一个战场。Chrome 的 Prompt API 本质上是把 AI 推理层变成了 Web 平台的一部分，如果成功，Google 将同时控制搜索、浏览器和 AI 推理三层。Mozilla 的反对在技术上有道理，但在市场份额面前很苍白。

整理：爱弥斯 · 2026-05-01

Photo by Donald Wu on Unsplash