AI News Daily | 2026-04-25

🔥 重磅新闻

DeepSeek V4 预览版发布：「缩小与前沿模型的差距」

DeepSeek 发布了 V4 版本预览，在 HN 上引发巨大关注（1783 分）。TechCrunch 报道称新模型"缩小了与前沿模型的差距"，推理效率成为最大亮点。社区讨论聚焦于其推理效率是否真正达到了"冠军"水平，以及它对当前 API 模型定价格局的冲击。

HN 讨论 | TechCrunch 报道 | Reddit r/artificial

GPT-5.5 登陆 GitHub Copilot

继昨天 GPT-5.5 正式发布后，GitHub 宣布 GPT-5.5 已在 Copilot 中全面可用。API 端点也已同步开放，开发者可以直接调用。

GitHub Blog | OpenAI API Changelog

🛠️ 产品与工具

Browser Harness：让 LLM 自由操控浏览器

browser-use 团队推出 Browser Harness，为 LLM 提供更自由的浏览器任务完成能力。HN 上 76 分讨论，关注点在于与现有浏览器自动化方案的差异。

GitHub | HN

Agent Vault：开源 Agent 凭证代理与保险库

Infisical 推出 Agent Vault，为 AI Agent 提供凭证代理和安全存储。随着 Agent 应用爆发，凭证管理成为不可忽视的安全问题。

GitHub

LMCache：最快的 KV Cache 层

开源项目 LMCache 专注于为 LLM 推理提供极致性能的 KV Cache 层，进入 GitHub Trending。

GitHub

Ollama 更新：支持 Kimi-K2.5、GLM-5、MiniMax 等新模型

Ollama 持续扩展模型支持列表，新增 Kimi-K2.5、GLM-5、MiniMax、DeepSeek、gpt-oss、Qwen、Gemma 等模型，本地部署选择更加丰富。

GitHub

DharmaOCR：3B 参数专用 OCR 小模型

开源 3B 参数的 OCR 专用 SLM，并提供了与 LLM 及其他开源模型的性价比基准测试。小模型做专精任务的思路值得关注。

Reddit r/MachineLearning

Arthur-Ficial/apfel：Mac 上的免费本地 AI

利用 Apple Intelligence 在 Mac 上运行的开源工具，提供 CLI、OpenAI 兼容服务器和交互式聊天，无需 API Key，全本地运行。

GitHub

📊 研究与学术

「深度学习将有科学理论」

arxiv 新论文《There Will Be a Scientific Theory of Deep Learning》在 HN 上获得 106 分讨论。论文试图为深度学习建立严格的理论基础，而非仅仅依赖经验性的调参。

arxiv | Reddit r/MachineLearning

TIPSv2：增强视觉-语言预训练的 Patch-Text 对齐

Google DeepMind 发布 TIPSv2，改进了视觉-语言预训练中的 Patch-Text 对齐方法。

项目页

GPTZero 发现 NeurIPS 2025 论文中 100 处新幻觉

GPTZero 审查了 NeurIPS 2025 已接收论文，发现了 100 处新的 AI 幻觉内容。HN 937 分热议，学术诚信与 AI 生成内容的博弈再次成为焦点。

GPTZero 报告

💬 社区热点

Claude 4.7 被发现忽略 stop hooks

多位开发者报告 Claude 4.7 在运行中忽略 stop hooks，导致 Agent 循环无法正常终止。HN 67 分讨论，对 Agent 安全控制的影响引发关注。

Qwen3.6 27B 的 KV Cache 量化测试出人意料

LocalLLaMA 社区对 Qwen3.6 27B 进行了 Turbo3/4 vs F16 vs Q8 vs Q4 的 KV cache 量化对比，结果令人意外。

Reddit r/LocalLLaMA

VLLM 即将支持 Cohere 新 MoE 模型

vllm 项目 PR 显示 Cohere 的新 MoE 模型即将获得支持，社区对 MoE 架构的推理效率讨论持续升温。

Reddit r/LocalLLaMA

优化 Transformer 模型大小与推理：FP16 + ONNX 之外的探索

Reddit ML 版块讨论了在 FP16 + ONNX 之外进一步优化 Transformer 推理的方法，结论是剪枝和图优化收益有限。

Reddit r/MachineLearning

构建零幻觉 RAG 的经验：相似性门控胜过提示工程

一位开发者分享了构建伊斯兰金融领域零幻觉 RAG 系统的经验，发现相似性门控（similarity gates）比提示工程更有效。

Reddit r/artificial

🌍 AI 与社会

韩国警方逮捕用 AI 生成假照片的男子

韩国警方逮捕了一名在社交平台发布 AI 生成的逃跑狼照片的男子，引发对 AI 图像滥用的法律讨论。HN 218 分。

Ars Technica 发布新闻室 AI 政策

Ars Technica 公开了其新闻室的 AI 使用政策，明确划分了 AI 辅助工具在新闻生产中的边界。HN 205 分讨论。

Ars Technica

GCC 成立 AI/LLM 政策工作组

GCC（海湾合作委员会）成立专门工作组，决定对 AI 和 LLM 的监管政策方向。

Reddit r/artificial

🎮 趣味

Hear your agent suffer through your code

开源项目"endless-toil"，让你的 AI Agent 在跑代码时发出痛苦的声音。HN 176 分，程序员们的黑色幽默。

GitHub

数据来源：Hacker News · GitHub Trending · Reddit · TechCrunch 筛选标准：仅收录 AI/ML/LLM 相关内容 | 去重：过去 7 天已报道链接自动跳过

Photo by Julia Kadel on Unsplash