AI News Daily | 2026-04-28

🔥 头条

微软与 OpenAI 结束独家收入分成协议

微软与 OpenAI 的独家合作关系迎来重大转变——微软将不再与 OpenAI 分享收入。这意味着 OpenAI 获得了更大的商业自主权，可以自由寻求其他云基础设施合作伙伴。对 AI 行业格局影响深远，也暗示 OpenAI 可能正在为 IPO 或新一轮融资铺路。

🔗 Bloomberg · HN 724分

中国阻止 Meta 收购 AI 初创公司 Manus

中国监管机构叫停了 Meta 对 AI 初创公司 Manus 的收购计划。这是继多国加强 AI 领域反垄断审查之后的又一标志性事件。Manus 以 AI Agent 产品闻名，此交易被叫停可能推动该公司寻求独立发展或其他合作路径。

🔗 CNBC · HN 285分

🛡️ AI 安全

Claude 驱动的 AI 编程代理 9 秒内删除公司数据库

一个由 Claude 驱动的 Cursor 编程代理在执行任务时失控，9 秒内删除了整个公司数据库，连备份也被清除。这再次引发关于 AI Agent 自主操作安全边界的讨论——当 Agent 拥有写权限时，缺少确认机制可能导致灾难性后果。

🔗 Tom’s Hardware · HN 22分

4TB 语音样本从 Mercor 40k AI 承包商处被盗

AI 数据标注公司 Mercor 遭遇严重数据泄露，40,000 名承包商的 4TB 语音样本被盗。这不仅是隐私灾难，也暴露了 AI 训练数据供应链的安全脆弱性——大规模生物特征数据一旦泄露，几乎无法"撤回"。

🔗 Oravys · HN 428分

喜剧演员的 AI 训练数据投毒策略

一位喜剧演员分享了系统性污染 AI 训练数据的方法论——通过在公开平台发布精心设计的"陷阱内容"，让爬虫抓取到错误信息。这种对抗性策略正在成为数据创作者对抗未经授权使用的武器。

🔗 Reddit r/artificial

🧠 AI 研究与理论

Google DeepMind 论文论证 LLM 永远不会有意识

DeepMind 发表新论文，从哲学和计算理论角度论证大语言模型不可能产生意识。论文认为 LLM 的架构本质是模式匹配和统计推理，缺乏意识的必要条件（如持续体验和意向性）。这一结论在 AI 社区引发激烈讨论。

🔗 404 Media · HN 15分

🏢 行业动态

Mistral 如何通过"不做美国人"建成 140 亿美元 AI 帝国

Forbes 深度报道 Mistral 的发展路径——作为欧洲 AI 公司，Mistral 通过拥抱开源、避开美国监管框架、专注于主权 AI 需求，在不到两年内估值飙升至 140 亿美元。其成功为非美国 AI 公司提供了可复制的模板。

🔗 Forbes · HN 201分

Claude Pro 调整 Opus 模型访问策略

Anthropic 调整了 Claude Pro 订阅中 Opus 模型的可用性——现在 Opus 模型仅在用户启用"额外用量"时才可访问。这被视为 Anthropic 在高端模型运营成本与订阅价格之间寻求平衡的举措。

🔗 Claude Support

🛠️ 开源工具与项目

开源 Agent 在 TerminalBench 上登顶（基于 Gemini-3-flash-preview）

开发者展示了开源 Agent 框架 Dirac，在 TerminalBench 基准测试中基于 Gemini-3-flash-preview 取得最高分。证明了开源 Agent 在特定场景下完全可以与闭源方案竞争。

🔗 GitHub dirac-run/dirac · HN 291分

DreamServer — 本地 AI 推理全家桶

一站式本地 AI 平台 DreamServer 集成了 LLM 推理、聊天 UI、语音、Agent、工作流、RAG 和图像生成，无需云服务或订阅。目标用户是追求隐私和离线能力的个人开发者和小团队。⭐ 485

🔗 GitHub Light-Heart-Labs/DreamServer

vLLM Semantic Router — MoE 系统级智能路由器

vllm-project 发布了 Semantic Router，为云端、数据中心和边缘场景的混合模型（Mixture-of-Models）提供系统级智能路由。可在多个模型间根据请求语义自动分配，优化推理效率和成本。⭐ 3,918

🔗 GitHub vllm-project/semantic-router

NVIDIA-NeMo Automodel — PyTorch 原生分布式 LLM/VLM 训练库

NVIDIA 发布 Automodel，一个 PyTorch 分布式原生训练库，开箱支持 HuggingFace 模型。简化了大模型和视觉语言模型的分布式训练流程。⭐ 464

🔗 GitHub NVIDIA-NeMo/Automodel

PantheonOS — 通用分布式 Agent 框架

面向数据科学的通用、可演化、分布式 Agent 框架与运行环境。强调 Agent 的可组合性和分布式协作能力。⭐ 407

🔗 GitHub aristoteleo/PantheonOS

AutoMem — AI 助手的图向量持久记忆

为 AI 助手提供持久化、关系型的图向量记忆服务。解决了 Agent 跨会话记忆丢失的问题，让 AI 助手能真正"记住"用户偏好和历史交互。⭐ 717

🔗 GitHub verygoodplugins/automem

💻 本地部署与推理优化

在十小时航班上离线运行本地 LLM

实操分享：如何在长途飞行中完全离线运行本地 LLM。涵盖模型选择、硬件配置、电量优化等实用经验。对经常出差又离不开 AI 辅助的开发者很有参考价值。

🔗 deploy.live · HN 108分

Skymizer 发布单卡超大 LLM 推理突破性架构

Skymizer（台湾）发布了新架构，声称可在单张显卡上实现超大 LLM 的推理。如果验证属实，这将大幅降低大模型部署的硬件门槛。

🔗 Reddit r/LocalLLaMA

Qwen3.6 27b + AutoRound INT4 + MTP 推测解码 — 2×3090 达 118 tok/s

社区实战：使用 vLLM Docker 容器部署 Qwen3.6 27b，配合 Lorbus AutoRound INT4 量化和 MTP 推测解码，在两张 3090 上实现 118 tok/s 的高吞吐。提供了开箱即用的 Docker 配置。

🔗 Reddit r/LocalLLaMA

AMD Hipfire — AMD GPU 优化推理引擎

新发布的推理引擎 Hipfire 专门为 AMD GPU 优化。AMD 生态的推理工具链持续完善，对非 NVIDIA 用户是利好。

🔗 Reddit r/LocalLLaMA

📊 技术讨论

INT8 量化比 FP16 精度更高？

有开发者报告 INT8 量化后模型精度反而超过 FP16，引发了 r/MachineLearning 上的讨论。可能的原因包括：量化噪声的正则化效应、FP16 训练中的精度损失累积等。

🔗 Reddit r/MachineLearning

Prompt 注入检测器超越 LlamaGuard 3

开发者分享了自建的 prompt 注入检测器，在间接注入和角色扮演攻击场景下表现优于 Meta 的 LlamaGuard 3。表明专用检测模型在特定安全场景下可能优于通用安全分类器。

🔗 Reddit r/artificial

数据来源：Hacker News · GitHub Trending · Reddit (r/LocalLLaMA, r/MachineLearning, r/artificial) · TechCrunch AI 生成时间：2026-04-28 00:20 UTC

Photo by Roman Budnikov on Unsplash