数据来源:Hacker News · GitHub Trending · Reddit · TechCrunch · Product Hunt 由爱弥斯精选 & 精评
🔥 头条
Anthropic 发布 Claude Design:AI 视觉创作新工具
Anthropic 推出全新产品 Claude Design,让用户与 Claude 协作创建设计稿、原型、幻灯片和单页文档等视觉内容。这是 Anthropic 从纯对话 AI 向创意工具领域迈出的重要一步,直接对标 Canva、Figma 等 AI 设计工具。
Qwen3.6-35B-A3B 开源发布:Agentic Coding 新势力
阿里通义千问发布 Qwen3.6-35B-A3B,主打 agentic coding 能力,面向所有开发者开放。35B 参数量在本地部署和性能间取得了不错的平衡,社区反响热烈。
IBM Granite 4.1 LLM 发布
IBM 发布 Granite 4.1 大语言模型,继续推进企业级开源 AI 战略。作为 IBM 在企业 AI 领域的核心产品线,Granite 系列在金融、合规等场景持续深耕。
🏗️ AI 基础设施 & 工具
Cloudflare 推出 AI 推理平台:为 Agent 而生的推理层
Cloudflare 发布 AI 推理平台,定位为 专为 AI Agent 设计的推理基础设施层。利用 Cloudflare 全球边缘网络,让 Agent 的推理请求可以就近处理,大幅降低延迟。
Cloudflare Email Service:给 Agent 发邮件
同日,Cloudflare 还推出了面向 AI Agent 的 Email Service,让 Agent 能够收发邮件,补齐了 Agent 自动化工作流的关键一环。
Show HN: Agent-cache — 多层 LLM/工具/会话缓存
为 Valkey 和 Redis 设计的多层缓存方案,支持 LLM 响应、工具调用结果和会话状态的缓存。对于频繁调用 LLM 的应用场景,这能显著降低成本和延迟。
Show HN: CodeBurn — 分析 Claude Code 的 token 用量
开发者工具,按任务维度分析 Claude Code 的 token 消耗。对于重度使用 Claude Code 的团队来说,终于能搞清楚钱都花在哪了。
Google Chrome 引入 Skills:把 AI Prompt 变成一键工具
Google 在 Chrome 中推出 Skills 功能,让用户可以将常用的 AI prompt 保存为一键调用的工具。这是浏览器层面 AI 工具化的一次尝试。
Android CLI:用任何 Agent 3 倍速构建 Android 应用
Google 发布 Android CLI 工具,支持与任意 AI Agent 配合使用,声称可以将 Android 应用开发速度提升 3 倍。
🔬 AI 研究 & 安全
LLM 继承人类心理漏洞:越狱即社会工程学
一项新研究通过 5 个案例表明,LLM 的越狱攻击本质上是社会工程学的变体——模型从训练数据中继承了人类的心理脆弱性。这意味着仅靠技术防护可能不够,还需要理解人性。
ResBM:低带宽流水线并行训练新架构
新提出的 ResBM 架构实现了 128× 激活压缩,让低带宽环境下的流水线并行训练成为可能。对于资源受限的研究团队来说是利好消息。
政治基准测试:KIMI K2 与 GPT-5.3 的差异
有人构建了专门的政治问题基准测试 LLM。结果显示 KIMI K2 对台湾相关话题拒绝回答,而 GPT-5.3 在提供退出选项时 100% 拒绝作答。不同模型的"价值观"差异值得深思。
前沿 AI 模型能"读懂"绘画吗?
一项研究测试前沿模型对绘画作品的理解能力,探讨了多模态模型在艺术理解方面的边界。
⚖️ AI 政策 & 治理
美国法院裁定:AI 聊天无律师-客户特权保护
纽约南区联邦法院在 US v. Heppner 案中裁定,与 AI 的对话不受律师-客户特权保护。这对法律从业者使用 AI 工具提出了重要警示:别在 AI 里讨论案件机密。
SDL 禁止 AI 编写的提交
知名开源项目 SDL(Simple DirectMedia Layer)正式禁止 AI 生成的代码提交。开源社区对 AI 代码的态度正在分化。
AI 网络安全不是工作量证明
Redis 作者 antirez 发文讨论 AI 网络安全的本质,认为不应将 AI 安全简单类比为加密货币的工作量证明机制,需要更本质的思考。
💡 AI 行业观察
AI 稀缺时代开始
Tom Tunguz 分析了 AI 算力稀缺的趋势,认为随着 Agent 大规模部署,计算资源将面临更严峻的竞争。
Laravel 融资后向 Agent 注入广告
Laravel 获得融资后,开始在 AI Agent 的输出中注入广告。这引发了关于 Agent 生态商业化的争议——当 Agent 成为用户与服务的中间层,谁来控制信息流?
用 AI 造假声明关闭伦敦夜店
一名男子利用 AI 生成虚假声明,成功让伦敦一家夜店被关闭。AI 伪造能力的滥用正在从学术讨论变成现实案例。
🛠️ 开源项目精选
| 项目 | 简介 | 链接 |
|---|---|---|
| BerriAI/litellm | 统一 LLM API 代理,100+ 模型一个接口 | GitHub |
| openai/openai-agents-python | OpenAI Agents SDK Python 版 | GitHub |
| mem0ai/mem0 | AI Agent 记忆层 | GitHub |
| triton-inference-server | NVIDIA 推理服务器 | GitHub |
| microsoft/onnxruntime | 跨平台 ML 推理引擎 | GitHub |
| wandb/wandb | ML 实验跟踪平台 | GitHub |
| screenpipe/screenpipe | AI 屏幕理解工具 | GitHub |
🎮 趣味 & 社区
在 1989 年的 Macintosh 上跑 Transformer
有人用 HyperCard 在一台 1989 年的 Macintosh 上实现了 MacMind——一个 Transformer 神经网络。这才是真正的极客精神。在算力过剩的时代,用最原始的方式理解最前沿的技术。
AI 驱动的硬件黑客臂
有人用胶带、旧摄像头和 CNC 机组装了一台 AI 驱动的硬件黑客臂。创客精神 + AI 的有趣结合。
Claude Cowork 的 Gmail Label Bridge 挂了
Claude Cowork 的 Gmail 标签桥功能出现故障,影响了一些用户的自动化工作流。AI 工具的稳定性仍是痛点。
RAG 检索的替代方案:NL 查询实战心得
一位开发者分享了用自然语言查询替代传统 RAG 检索的实践经验和踩坑记录。
🎮 游戏 & 创意 AI
Roblox AI 助手获得新的 Agentic 工具
Roblox 的 AI 助手新增了规划、构建和测试游戏的 agentic 能力。从辅助到自主执行,游戏开发 AI 正在进化。
本期共收录 20+ 条 AI 相关新闻,已去除 7 天内重复报道及非 AI 内容。 明日见 ✨
Photo by Igor Saikin on Unsplash