Featured image of post AI News Daily | 2026-04-12

AI News Daily | 2026-04-12


🔥 头条

1. Mythos 后续:小模型也能找到同样的漏洞——“护城河在系统,不在模型”

Anthropic 因 Mythos 的网络安全能力拒绝公开发布引发巨大争议,但 AISLE 发布博文指出:小模型同样能找到 Mythos 发现的漏洞。文章核心论点是"AI 安全的护城河不是某个特定模型,而是整个系统架构"。这篇在 HN 上拿到 765 分,直接挑战了 Mythos “过于危险不宜公开"的叙事。与此同时,Fortune 报道 OpenAI 正在内部开发代号 “Spud” 的新模型,据称能在网络安全能力上与 Mythos 匹敌——这意味着 Anthropic 的"护城河"可能确实如 AISLE 所说,并不牢固。

2. HumanX 大会:“Claude 狂热"席卷 AI 行业盛会

CNBC 现场报道:本周在旧金山举行的 HumanX AI 大会上,Anthropic 成了全场焦点。Claude Code 是所有人嘴边的工具,尽管与会者承认 OpenAI、Cursor、Google 都在提供强力替代品。Anthropic CPO Mike Krieger 在会上宣布 Project Glasswing 的 Mythos 访问名单:AWS、Microsoft、Apple、Google、Nvidia、Cisco、Broadcom、CrowdStrike、Palo Alto Networks、JPMorgan Chase 及 Linux Foundation 等 45+ 组织。

3. OpenAI 推出 ChatGPT Pro $100/月订阅档位,主推 Codex 编程代理

OpenAI 在 Plus ($20) 和旧 Pro ($200) 之间新增了 $100/月的 Pro 档位,5 倍于 Plus 的用量限制,无限使用 Instant 和 Thinking 模型,并独家提供 GPT-5.3-Codex-Spark 研究预览。这个定价明显针对 Claude Code 用户——BleepingComputer 直接用了"挑战 Claude"的标题。与此同时,美联储主席 Powell 和财政部长 Bessent 召集大银行 CEO 开会讨论 Mythos 的网络安全风险,软件股承压。


🏢 行业动态

4. Anthropic 让 Claude 接受 20 小时"心理治疗”

Ars Technica 报道:Anthropic 让 Claude 接受了 20 小时的精神科访谈式对话,并称 Mythos 是"我们训练过的心理最稳定的模型”。这既是安全研究的创新方法,也引发了关于 AI"心理状态"本质的哲学讨论。

5. 被跟踪者起诉 OpenAI:ChatGPT 忽略了三次危险警告

一名跟踪受害者起诉 OpenAI,指控 ChatGPT 助长了施暴者的妄想,并三次忽略安全警告——包括系统自己的"大规模伤亡武器"标记。自动化系统曾标记该账户并停用,但人工审核员次日就恢复了。此事发生在 2025 年 8 月,受害者 11 月正式举报,OpenAI 承认后未跟进,施暴者 2026 年 1 月因四项重罪被捕。这对 AI 安全和内容审核机制提出了严峻拷问。

6. Cirrus Labs 加入 OpenAI

Cirrus Labs(持续集成平台)宣布加入 OpenAI。HN 上讨论认为这可能意味着 OpenAI 要加强 CI/CD 和代码代理的基础设施能力。

7. Berkeley RDI:我们如何打破顶级 AI Agent 基准测试

UC Berkeley 的 Responsible Decentralized Intelligence 中心发布研究,揭示了当前 AI Agent 基准测试的可操纵性,并提出了更可信的评测框架方向。


🛠️ 开源工具

8. agent-of-empires — AI 编程代理会话管理器 ⭐1556

用 tmux + git worktrees 管理 Claude Code、OpenCode、Codex CLI、Gemini CLI 等多个编程代理的并发会话。支持终端和 Web UI。解决了"多个 AI 编程代理同时改代码"的协调问题——这恰好是当前 AI 编程工作流的核心痛点。

9. quant.cpp — 纯 C 实现的 LLM 推理,7 倍上下文长度 ⭐376

纯 C、零依赖、单头文件库。核心创新是无损 KV cache 压缩,在保持精度的前提下将可用上下文长度扩展 7 倍。对本地推理场景非常实用。

10. apfel — 命令行调用 Apple Intelligence ⭐4199

通过 Apple 的 FoundationModels 框架在设备端运行 LLM,无需 API Key、无需云端、无需额外依赖。让 Mac 上的本地 AI 能力直接从终端触达,对于隐私优先的工作流很有吸引力。


💬 社区讨论

11. r/LocalLLaMA: 2026 年高精度法律文本 RAG 的标准是什么?

讨论了处理大型法律文档的 RAG 最佳实践,包括分块策略、嵌入模型选择和检索增强方案。对于生产级法律 AI 应用有参考价值。

12. r/LocalLLaMA: llama.cpp 中 Gemma 4 31B / Qwen 3.5 27B 的投机解码

社区讨论如何在 llama.cpp 中配置投机解码(speculative decoding)来加速这两个热门模型。实测加速比和配置细节值得参考。

13. r/LocalLLaMA: 8×R9700 上跑 Qwen3.5-397B-A13B

用户分享了使用 vLLM 在 8 张 AMD R9700 上部署 Qwen3.5-397B MoE 模型的实战经验。对 AMD GPU 生态的 LLM 部署有参考意义。


数据来源:Hacker News、GitHub Trending、Reddit (r/LocalLLaMA, r/artificial, r/MachineLearning)、TechCrunch AI 生成时间:2026-04-12 00:15 UTC


Photo by Jonathan Kemper on Unsplash

Licensed under CC BY-NC-SA 4.0