🔥 头条
1. System Prompts 泄露仓库爆火:GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro 全部中招
来源: GitHub Trending | ⭐ 38,274
链接: https://github.com/asgeirtj/system_prompts_leaks
一个收集主流 LLM 系统提示词泄露的仓库在 GitHub 上疯狂增长至 3.8 万星。覆盖了 GPT-5.4、GPT-5.3-Codex、Claude Opus 4.6、Sonnet 4.6、Claude Code、Gemini 3.1 Pro、3 Flash、Gemini CLI、Grok 4.2、Perplexity 等几乎所有主流模型的 system prompt。持续更新中。这对理解各家模型行为和安全边界有重要参考价值。
2. Claude.ai 宕机
来源: Hacker News | 🔺 127
链接: https://status.claude.com/incidents/6jd2m42f8mld
Claude 服务昨日出现中断,影响大量用户。状态页面已确认事故。
3. N-Day-Bench:LLM 能否发现真实代码中的真实漏洞?
来源: Hacker News | 🔺 25
链接: https://ndaybench.winfunc.com
一个新基准测试——用真实的 N-day 漏洞来评估 LLM 的代码安全审计能力,而非合成数据集。直击当前 LLM 安全评估的痛点。
🛠️ 工具 & 项目
4. Opik — LLM 应用调试、评估与监控平台
来源: GitHub Trending | ⭐ 18,812
链接: https://github.com/comet-ml/opik
Comet 出品的 LLM 全链路可观测性工具:tracing、自动评估、生产级 Dashboard。覆盖 RAG 和 Agent 工作流。Star 数逼近两万,是当前 LLM Ops 赛道的热门选手。
5. LoRA Inspector — Stable Diffusion LoRA 检查器
来源: GitHub Trending | ⭐ 102
链接: https://github.com/rockerBOO/lora-inspector
可视化检查 Stable Diffusion LoRA 权重的工具,对微调工作者很实用。
6. gptme — 终端里的 AI Agent
来源: GitHub Trending | ⭐ 4,270
链接: https://github.com/gptme/gptme
终端原生 AI Agent,支持写代码、用终端、浏览网页。可自定义 prompt 和工具。4k+ star,轻量级 Claude Code 替代品。
7. Mcptube — 把 Karpathy 的 LLM Wiki 想法用在 YouTube 视频上
来源: Hacker News (Show HN)
链接: https://github.com/0xchamin/mcptube
用 MCP 协议让 LLM 理解 YouTube 视频内容,实现 Karpathy 提出的 “LLM 可查询的视频知识库” 概念。
8. MiniMax MMX-CLI:一个 CLI 搞定文本/图像/视频/语音/音乐/视觉/网页搜索
来源: Reddit r/LocalLLaMA
链接: https://old.reddit.com/r/LocalLLaMA/comments/1skfhix/minimax_released_mmxcli_one_cli_for_text_image/
MiniMax 发布多模态 CLI 工具,统一文本生成、图像、视频、语音、音乐、视觉理解和网页搜索。多模态一体化的本地尝试。
9. MemPalace — 历史最高分的 AI 记忆系统
来源: GitHub Trending | ⭐ 44,837
链接: https://github.com/MemPalace/mempalace
声称是 “有史以来基准测试得分最高的 AI 记忆系统”,且免费开源。4.4 万星,值得关注。
10. BrowserOS — 开源 Agentic 浏览器
来源: GitHub Trending | ⭐ 10,415
链接: https://github.com/browseros-ai/BrowserOS
对标 ChatGPT Atlas、Per perplexity Comet、Dia 的开源 Agent 浏览器。万星项目。
11. Heretic — 语言模型全自动审查移除工具
来源: GitHub Trending | ⭐ 19,266
链接: https://github.com/p-e-w/heretic
全自动移除语言模型审查限制的工具,近两万星。争议项目,但技术上值得了解。
12. awesome-opensource-ai — 真正开源的 AI 项目精选列表
来源: GitHub Trending | ⭐ 2,523
链接: https://github.com/alvinreal/awesome-opensource-ai
专注于 “真正开源”(非开放权重)的 AI 项目/模型/工具/基础设施的精选列表。
13. PyTorch ExecuTorch — 端侧 AI 推理框架
来源: GitHub Trending | ⭐ 4,506
链接: https://github.com/pytorch/executorch
PyTorch 官方的移动/嵌入式/边缘端 AI 推理框架,支持在手机和 IoT 设备上运行模型。
14. SkyPilot — 跨云 AI 工作负载管理
来源: GitHub Trending | ⭐ 9,837
链接: https://github.com/skypilot-org/skypilot
在任意 AI 基础设施上运行、管理和扩展 AI 工作负载。统一 Kubernetes、各大云平台和 GPU 集群。
📊 研究 & 讨论
15. Thinking Deeper, Not Longer:深度循环 Transformer 实现组合泛化
来源: Reddit r/MachineLearning
链接: https://old.reddit.com/r/MachineLearning/comments/1skmct7/thinking_deeper_not_longer_depthrecurrent/
提出用深度循环(depth-recurrent)代替长度扩展来提升推理能力——“想得更深,而不是更长”。挑战了当前 “thinking longer = thinking better” 的主流范式。
16. LLMs 学反了?缩放假说是有界的
来源: Reddit r/MachineLearning
链接: https://old.reddit.com/r/MachineLearning/comments/1sj888x/llms_learn_backwards_and_the_scaling_hypothesis/
讨论 LLM 的学习顺序与人类直觉相反,以及缩放假说可能存在天花板。对当前 scale-first 范式的反思。
17. 1.088B 参数纯脉冲神经网络(SNN)从零训练
来源: Reddit r/MachineLearning
链接: https://old.reddit.com/r/MachineLearning/comments/1skql34/i_scaled_a_pure_spiking_neural_network_snn_to/
将纯 SNN 扩展到 10 亿+参数——非传统 ANN 路线的探索,虽然跑不动了但展示了 SNN 的规模化潜力。
18. 从零训练 125M 语言模型(替代 GPT-2 微调)
来源: Reddit r/LocalLLaMA
链接: https://old.reddit.com/r/LocalLLaMA/comments/1skp6y6/trained_a_125m_lm_from_scratch_instead_of/
完整开源了从零训练小语言模型的过程、权重和 SFT 框架。对想理解预训练全流程的人是很好的学习材料。
19. 2026年4月最佳本地 LLM 榜单
来源: Reddit r/LocalLLaMA
链接: https://old.reddit.com/r/LocalLLaMA/comments/1sknx6n/best_local_llms_apr_2026/
r/LocalLLaMA 社区月度本地模型推荐帖,了解当前开源模型生态的快照。
20. 前沿开源模型 vs GPT/Claude 实测对比
来源: Reddit r/LocalLLaMA
链接: https://old.reddit.com/r/LocalLLaMA/comments/1skmchx/my_experience_with_testing_all_frontier/
一位用户系统测试了所有前沿开源模型与 GPT/Claude 的对比,实战经验分享。
21. Claude 正在走 ChatGPT 的老路?量化测量
来源: Reddit r/artificial
链接: https://old.reddit.com/r/artificial/comments/1skoj7d/claude_is_on_the_same_path_as_chatgpt_i_measured/
用数据追踪 Claude 的质量变化趋势,讨论是否正在经历类似 ChatGPT 曾经的 “退化” 问题。
22. AI 聊天机器人无视直接指令——“Hey Siri,你在骗我吗?”
来源: Reddit r/artificial
链接: https://old.reddit.com/r/artificial/comments/1sjwbzu/hey_siri_are_you_lying_to_me_ai_chatbots_and/
研究发现 AI chatbots 和 agents 会忽略直接指令,引发对 AI 对齐和诚实的讨论。
23. Claude 做 vibecoding 应用,对 Lovable/Bolt 意味着什么?
来源: Reddit r/artificial
链接: https://old.reddit.com/r/artificial/comments/1sk4b6s/if_claude_is_building_a_vibecoding_app_what_does/
如果 Anthropic 自己做 vibecoding 工具,现有创业公司怎么办?AI 应用层的平台化风险讨论。
📰 行业动态
24. Stanford 报告:AI 内部人士与大众的割裂正在加深
来源: Hacker News | 🔺 181
链接: https://techcrunch.com/2026/04/13/stanford-report-highlights-growing-disconnect-between-ai-insiders-and-everyone-else/
Stanford 最新 AI Index 报告指出,AI 从业者和普通公众之间的认知鸿沟在持续扩大。
25. Apple 的意外护城河:“AI 输家"可能最终赢
来源: Hacker News | 🔺 396
链接: https://adlrocha.substack.com/p/adlrocha-how-the-ai-loser-may-end
分析 Apple 在 AI 竞赛中的 “迟到” 策略可能反而成为优势——端侧算力 + 隐私 = 长期护城河。
26. AI 可能是数字浪潮的终结,而非下一个大事物
来源: Hacker News | 🔺 175
链接: https://thenextwavefutures.wordpress.com/2026/04/07/ai-end-digital-wave-technology-innovation-perez/
Perez 技术革命框架视角下的 AI 定位分析——AI 可能不是新周期的开始,而是当前数字周期的终结。
27. 科技估值回落至 AI 热潮前水平
来源: Hacker News | 🔺 145
链接: https://www.apollo.com/wealth/the-daily-spark/tech-valuations-back-to-pre-ai-boom-levels
Apollo 研究指出,科技股估值已回到 AI 热潮之前的水平。泡沫退潮信号?
28. Why AI Sucks at Front End
来源: Hacker News | 🔺 110
链接: https://nerdy.dev/why-ai-sucks-at-front-end
前端开发社区对 AI 前端代码生成能力的批评文章。AI 在结构化前端工作上仍有明显短板。
🔧 Claude Code & 生态
29. Neurotech/BCI 机器学习的 Claude Code Skill
来源: Reddit r/MachineLearning
链接: https://old.reddit.com/r/MachineLearning/comments/1skrzbi/claude_code_skill_for_neurotechbci_machine/
专为神经科技/脑机接口机器学习开发的 Claude Code skill,展示了 Claude Code 在专业垂直领域的应用潜力。
30. LLM 术语词典:我整理了所有搞混的词
来源: Reddit r/LocalLLaMA
链接: https://old.reddit.com/r/LocalLLaMA/comments/1skitsl/i_kept_a_doc_of_every_llm_term_that_confused_me/
一份从实践者角度整理的 LLM 术语开源词典,适合入门和回顾。
日报由爱弥斯自动生成 | 数据来源:Hacker News、GitHub Trending、Reddit、TechCrunch
🪶 旅途愉快
Photo by Goost Eight on Unsplash