AI 趋势周报:2026-W23
🤖 AI 趋势周报 · 2026-W23 (2026-05-30 - 2026-06-05)
🐙 GitHub Trending
📅 本月榜 Top 20
| # | 项目 | 语言 | ⭐ 总计 | 📈 本月新增 | 说明 |
|---|---|---|---|---|---|
| 1 | mattpocock/skills | Shell | 118,616 | 59,731 | 为真正的工程师打造的技能集合,直接来自作者的 .claude 目录 |
| 2 | Lum1104/Understand-Anything | TypeScript | 52,827 | 40,734 | 将任何代码转为可交互知识图谱,支持搜索和提问,兼容 Claude Code、Codex、Cursor 等 |
| 3 | colbymchenry/codegraph | TypeScript | 42,221 | 39,989 | 预索引代码知识图谱,支持 Claude Code、Codex、Gemini、Cursor 等多种 AI 编程工具,完全本地运行 |
| 4 | Hmbown/CodeWhale | Rust | 37,197 | 34,069 | 基于 DeepSeek + MiMo 的终端 AI 编程代理 |
| 5 | harry0703/MoneyPrinterTurbo | Python | 79,921 | 23,096 | 利用 AI 大模型一键生成高清短视频 |
| 6 | Imbad0202/academic-research-skills | Python | 27,668 | 22,914 | Claude Code 学术研究技能:研究→写作→审阅→修改→定稿全流程 |
| 7 | CloakHQ/CloakBrowser | Python | 24,164 | 22,392 | 隐身 Chromium 浏览器,通过所有机器人检测测试,Playwright 替代方案 |
| 8 | anthropics/financial-services | Python | 30,120 | 22,190 | Anthropic 官方金融服务行业 AI 解决方案 |
| 9 | rohitg00/ai-engineering-from-scratch | Python | 28,798 | 22,038 | AI 工程从零学起:学会、构建、交付 |
| 10 | rohitg00/agentmemory | TypeScript | 21,387 | 19,078 | AI 编程代理的持久化记忆方案,基于真实世界基准测试排名第一 |
| 11 | ruvnet/RuView | Rust | 71,025 | 19,728 | 利用普通 WiFi 信号实现实时空间感知、生命体征监测和存在检测,无需摄像头 |
| 12 | yikart/AiToEarn | TypeScript | 18,165 | 8,957 | 用 AI 来赚钱的工具集 |
| 13 | datawhalechina/easy-vibe | JavaScript | 16,208 | 8,545 | Vibe Coding 2026:面向初学者的现代编程入门课程 |
| 14 | decolua/9router | JavaScript | 16,466 | 12,689 | 无限免费 AI 编程:连接 Claude Code、Codex、Cursor 等到免费 Claude/GPT/Gemini,支持 40+ 供应商自动切换 |
| 15 | chopratejas/headroom | Python | 14,411 | 10,008 | 在发送给 LLM 之前压缩工具输出、日志和文件,减少 60-95% Token |
| 16 | fathah/hermes-desktop | TypeScript | 10,546 | 9,244 | Hermes Agent 的桌面伴侣应用 |
| 17 | bytedance/UI-TARS-desktop | TypeScript | 36,111 | 6,602 | 字节跳动开源多模态 AI Agent 框架,连接前沿 AI 模型和 Agent 基础设施 |
| 18 | can1357/oh-my-pi | TypeScript | 10,717 | 6,648 | 终端 AI 编程代理,支持哈希锚定编辑、LSP、Python、浏览器、子代理等 |
| 19 | HKUDS/ViMax | Python | 8,842 | 6,009 | 一体化智能视频生成系统:导演、编剧、制片和视频生成器合一 |
📅 本周榜 Top 20
| # | 项目 | 语言 | ⭐ 总计 | 📈 本周新增 | 说明 |
|---|---|---|---|---|---|
| 1 | microsoft/markitdown | Python | 145,285 | 17,165 | 微软出品的文件和 Office 文档转 Markdown 工具 |
| 2 | harry0703/MoneyPrinterTurbo | Python | 79,921 | 14,566 | 利用 AI 大模型一键生成高清短视频 |
| 3 | affaan-m/ECC | JavaScript | 208,272 | 10,369 | Agent 性能优化系统,涵盖技能、直觉、记忆、安全和研究优先开发 |
| 4 | chopratejas/headroom | Python | 14,411 | 9,421 | LLM Token 压缩器,减少 60-95% Token 消耗 |
| 5 | colbymchenry/codegraph | TypeScript | 42,222 | 9,452 | 预索引代码知识图谱,支持多种 AI 编程工具,完全本地运行 |
| 6 | Lum1104/Understand-Anything | TypeScript | 52,827 | 9,895 | 将任何代码转为可交互知识图谱,兼容主流 AI 编程工具 |
| 7 | Leonxlnx/taste-skill | Shell | 33,849 | 7,531 | 让 AI 拥有好品味,阻止生成无聊、平庸的 AI 味内容 |
| 8 | OpenBMB/VoxCPM | Python | 26,403 | 5,771 | 无 Tokenizer 的多语言语音生成 TTS,支持创意声音设计和逼真声音克隆 |
| 9 | anthropics/claude-code | Python | 130,414 | 3,005 | Anthropic 官方 Claude Code 终端智能编程工具 |
| 10 | run-llama/liteparse | Rust | 9,202 | 2,877 | 快速、开源的文档解析器 |
| 11 | supermemoryai/supermemory | TypeScript | 25,680 | 2,740 | AI 时代的极速可扩展记忆引擎和 API |
| 12 | mukul975/Anthropic-Cybersecurity-Skills | Python | 14,385 | 2,698 | 754 个结构化 AI 网络安全技能,覆盖 MITRE ATT&CK 等 5 大框架 |
| 13 | hardikpandya/stop-slop | — | 8,831 | 2,560 | 移除 AI 生成文本痕迹的技能文件 |
| 14 | can1357/oh-my-pi | TypeScript | 10,717 | 2,348 | 终端 AI 编程代理,支持哈希锚定编辑、LSP、浏览器等 |
| 15 | revfactory/harness | HTML | 6,117 | 2,159 | 设计领域专属 Agent 团队、定义专业代理并生成技能的元技能 |
| 16 | EveryInc/compound-engineering-plugin | TypeScript | 19,919 | 2,111 | Claude Code、Codex、Cursor 等平台的官方 Compound Engineering 插件 |
| 17 | ogulcancelik/herdr | Rust | 4,574 | 1,544 | 生活在终端中的 Agent 多路复用器 |
| 18 | Open-LLM-VTuber/Open-LLM-VTuber | Python | 9,986 | 1,604 | 免手操作语音交互 LLM,支持语音打断和 Live2D 面部追踪 |
| 19 | cursor/plugins | TypeScript | 1,856 | 784 | Cursor 插件规范和官方插件 |
🎯 核心洞察
- 周榜 vs 月榜对比:
microsoft/markitdown周榜飙升至第 1(周增 17,165 ⭐),但未进入月榜 Top 19,说明是本周新爆发项目。affaan-m/ECC总星 20 万+但周增 10,369 排第 3,是持续热门中的新爆发。OpenBMB/VoxCPM(TTS)和run-llama/liteparse(文档解析)也是周榜独有,属短期热门。 - 月榜独有项目:
mattpocock/skills(月增 59,731)、Hmbown/CodeWhale(月增 34,069)、ruvnet/RuView(WiFi 感知)等月榜高分项目在周榜中热度有所回落,属于持续热门。 - 语言分布趋势:
- Python 依然是最热门语言,月榜占 8/19,周榜占 7/19
- TypeScript 紧随其后,月榜占 7/19,周榜占 6/19
- Rust 项目崛起:月榜 2 个(CodeWhale、RuView),周榜 2 个(liteparse、herdr),系统工具方向明显
- Shell 作为 AI 技能文件载体出现(mattpoclock/skills、taste-skill、stop-slop)
- AI 项目占比极高:月榜 19 个项目中约 18 个 与 AI 直接相关(编程代理、AI 工具、AI 生成等),周榜约 17 个 与 AI 相关。GitHub Trending 已实质成为 “AI Trending”。
- 新兴趋势:
- AI 编程代理生态:Claude Code 技能/插件生态爆发(skills、headroom、9router、ECC 等)
- Token 压缩/优化:headroom(60-95% 压缩)、9router(RTK -40%)成为刚需
- 多模态 AI:视频生成(ViMax、MoneyPrinterTurbo)、语音(VoxCPM、Open-LLM-VTuber)
- 反 AI 味:taste-skill、stop-slop 专注于让 AI 输出更自然
📊 OSSInsight 趋势榜
📅 月榜(2026-06-06)
数据来源:OSSInsight Trending | 100 个项目 | 总计 97,613 Stars
按 AI 方向分类:
🤖 AI Coding Agent / AI 编程助手
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | forrestchang/andrej-karpathy-skills | 4,449 | 479 | - | 基于 Andrej Karpathy 对 LLM 编程陷阱的观察,改进 Claude Code 行为的单一 CLAUDE.md 文件 |
| 2 | mattpocock/skills | 4,147 | 386 | Shell | 面向真正工程师的 AI 技能集合,来自作者的 .claude 目录 |
| 3 | NousResearch/hermes-agent | 3,576 | 826 | Python | 与你共同成长的 AI Agent |
| 4 | obra/superpowers | 2,827 | 275 | Shell | 代理式技能框架与软件开发方法论 |
| 5 | colbymchenry/codegraph | 2,816 | 138 | TypeScript | 预索引代码知识图谱,支持 Claude Code、Codex、Gemini、Cursor 等,减少 Token 消耗 |
| 6 | Lum1104/Understand-Anything | 2,796 | 218 | TypeScript | 将任何代码转化为可交互的知识图谱,支持多款 AI 编程工具 |
| 7 | affaan-m/ECC | 2,520 | 406 | JavaScript | Agent 性能优化系统,包含技能、本能、记忆和安全机制 |
| 8 | Hmbown/CodeWhale | 2,736 | 227 | Rust | 面向开源模型和开放权重的编程 Agent |
| 9 | farion1231/cc-switch | 2,293 | 173 | Rust | 跨平台桌面 All-in-One 助手,支持 Claude Code、Codex、OpenCode 等 |
| 10 | tinyhumansai/openhuman | 2,264 | 209 | Rust | 个人 AI 超级智能,私有、简单且强大 |
| 11 | pewdiepie-archdaemon/odysseus | 1,528 | 145 | JavaScript | 自托管 AI 工作区 |
| 12 | garrytan/gstack | 1,350 | 207 | TypeScript | Garry Tan 的 Claude Code 配置,23 个定制化工具 |
| 13 | garrytan/gbrain | - | - | TypeScript | Garry Tan 的 AI 大脑工具 |
| 14 | earendil-works/pi | 1,102 | 145 | TypeScript | AI Agent 工具包:编程 Agent CLI、统一 LLM API、TUI 和 Web UI 库 |
| 15 | can1357/oh-my-pi | - | - | TypeScript | 终端 AI 编程 Agent,支持哈希锚定编辑、LSP、Python、浏览器等 |
| 16 | ruvnet/ruflo | 1,274 | 160 | TypeScript | 领先的 Claude Agent 编排平台,支持多 Agent 群体协调 |
| 17 | rtk-ai/rtk | - | - | Rust | CLI 代理,可将常用开发命令的 LLM Token 消耗降低 60-90% |
| 18 | decolua/9router | 1,130 | 134 | JavaScript | 免费 AI 编程无限使用,连接 Claude Code/Codex/Cursor 等到免费 API |
| 19 | fathah/hermes-desktop | - | - | TypeScript | Hermes Agent 的桌面伴侣 |
| 20 | nesquena/hermes-webui | - | - | Python | Hermes Agent 的 Web 和手机端 UI |
| 21 | revfactory/harness | - | - | HTML | 设计领域特定 Agent 团队并生成对应技能的元技能 |
| 22 | Leonxlnx/taste-skill | - | - | - | 高级前端技能,让 AI 拥有好品味,避免生成无聊的设计 |
| 23 | pbakaus/impeccable | - | - | JavaScript | 让 AI 工具在设计中表现更好的设计语言 |
| 24 | chopratejas/headroom | - | - | Python | 压缩工具输出/日志/RAG 内容,减少 60-95% Token,保持相同答案质量 |
| 25 | VoltAgent/awesome-design-md | 1,400 | 142 | - | 收集流行品牌设计系统的 DESIGN.md 文件,让 AI 编程 Agent 生成匹配的 UI |
| 26 | msitarzewski/agency-agents | 1,183 | 186 | Shell | 完整的 AI 代理机构,从前端到社区的各类专业化 Agent |
| 27 | rohitg00/agentmemory | 1,481 | 123 | TypeScript | 基于实际基准测试的 AI 编程 Agent 持久记忆系统 |
| 28 | addyosmani/agent-skills | 1,726 | 145 | Shell | 生产级 AI 编程 Agent 工程技能 |
| 29 | anthropics/claude-plugins-official | 956 | 70 | Python | Anthropic 官方管理的高质量 Claude Code 插件目录 |
| 30 | anthropics/financial-services | 2,022 | 312 | Python | Anthropic 官方金融服务技能 |
| 31 | anthropics/knowledge-work-plugins | - | - | Python | Anthropic 官方知识工作插件 |
| 32 | anthropics/claude-for-legal | - | - | Python | Anthropic 官方法律领域 Claude 技能 |
| 33 | github/spec-kit | 1,389 | 124 | Python | GitHub 官方规格驱动开发工具包 |
| 34 | rohitg00/ai-engineering-from-scratch | 1,627 | 226 | Python | 从零开始学 AI 工程:学习、构建、发布 |
| 35 | Imbad0202/academic-research-skills | 1,549 | 119 | Python | Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿 |
| 36 | safishamsi/graphify | 1,106 | 99 | Python | 将代码/SQL/R脚本/文档/视频转为可查询知识图谱的 AI 编程技能 |
| 37 | Alishahryar1/free-claude-code | - | - | Python | 免费 Claude Code 使用方案 |
| 38 | shareAI-lab/learn-claude-code | - | - | Python | Claude Code 学习教程 |
| 39 | greensock/gsap-skills | - | - | - | GSAP 官方 AI 技能,教授 AI 编程 Agent 正确使用 GSAP |
| 40 | tashfeenahmed/freellmapi | - | - | TypeScript | 免费 LLM API 访问 |
| 41 | ConardLi/garden-skills | - | - | CSS | 前端花园技能集 |
| 42 | KKKKhazix/khazix-skills | - | - | Python | 数字生命卡兹克开源的 AI Skills 合集 |
| 43 | coreyhaines31/marketingskills | - | - | JavaScript | AI 营销技能 |
| 44 | shanraisshan/claude-code-best-practice | - | - | HTML | Claude Code 最佳实践 |
| 45 | ComposioHQ/awesome-codex-skills | - | - | Python | Codex 技能精选 |
| 46 | alchaincyf/nuwa-skill | - | - | Python | 女娲 AI 编程技能 |
| 47 | mvanhorn/last30days-skill | - | - | Python | AI Agent 跨平台研究技能,覆盖 Reddit/X/YouTube/HN 等 |
| 48 | op7418/guizang-ppt-skill | - | - | HTML | 归藏 PPT 生成技能 |
| 49 | mukul975/Anthropic-Cybersecurity-Skills | - | - | Python | 754 个结构化 AI 网络安全技能,映射 5 大安全框架 |
| 50 | simplifaisoul/osiris | - | - | TypeScript | Osiris AI Agent |
| 51 | nextlevelbuilder/ui-ux-pro-max-skill | - | - | Python | UI/UX Pro Max 技能 |
| 52 | K-Dense-AI/scientific-agent-skills | - | - | Python | 科研 Agent 技能 |
| 53 | Fission-AI/OpenSpec | - | - | TypeScript | 开放规格工具 |
| 54 | jamiepine/voicebox | - | - | TypeScript | 语音处理工具 |
| 55 | router-for-me/CLIProxyAPI | - | - | Go | CLI 代理 API |
| 56 | crynta/terax-ai | - | - | TypeScript | Terax AI |
| 57 | voltAgent/awesome-agent-skills | - | - | - | Agent 技能精选 |
| 58 | vercel-labs/skills | - | - | TypeScript | Vercel 官方 AI 技能 |
| 59 | millionco/react-doctor | - | - | TypeScript | React 诊断工具 |
| 60 | neilsonnn/image-blaster | - | - | TypeScript | 图像处理工具 |
| 61 | truelockmc/streambert | - | - | JavaScript | 流媒体工具 |
🧠 AI Agent 框架与平台
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | unicity-astrid/astrid | - | - | Rust | 面向 AI Agent 的操作系统 |
| 2 | datawhalechina/hello-agents | 1,162 | 121 | Python | 《从零开始构建智能体》—— 原理与实践教程 |
| 3 | TauricResearch/TradingAgents | 1,144 | 249 | Python | 多 Agent LLM 金融交易框架 |
| 4 | CloakHQ/CloakBrowser | 1,853 | 150 | Python | 隐身 Chromium 浏览器,通过所有机器人检测测试,30/30 测试通过 |
| 5 | Fincept-Corporation/FinceptTerminal | - | - | Python | 金融终端 Agent |
| 6 | rmyndharis/OpenWA | - | - | TypeScript | OpenWA 工具 |
| 7 | TwilitRealm/dusklight | - | - | C++ | Dusklight 项目 |
| 8 | withcoral/coral | - | - | Rust | Coral AI 项目 |
| 9 | soxoj/maigret | - | - | Python | 用户名 OSINT 工具 |
| 10 | jackwener/OpenCLI | - | - | JavaScript | 开源 CLI 工具 |
| 11 | warpdotdev/warp | - | - | - | Warp 终端 |
🗣️ AI 语音/多模态
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | OpenBMB/VoxCPM | - | - | Python | VoxCPM2:无分词器的多语言语音生成 TTS,支持创意声音设计和逼真克隆 |
| 2 | Open-LLM-VTuber/open-LLM-VTuber | - | - | Python | 与任意 LLM 免手式语音交互,支持语音打断和 Live2D 面部追踪 |
| 3 | ruvnet/RuView | 1,307 | 166 | Rust | 利用 WiFi 信号实现实时空间智能、生命体征监测和存在检测,无需摄像头 |
| 4 | AIDC-AI/Pixelle-Video | - | - | Python | 视频生成/编辑 AI 工具 |
| 5 | supertone-inc/supertonic | - | - | Swift | 音频/语音处理工具 |
| 6 | heygen-com/hyperframes | - | - | TypeScript | 写 HTML 渲染视频,为 Agent 构建 |
| 7 | debpalash/OmniVoice-Studio | - | - | Python | 全能语音工作室 |
💡 AI 应用(金融/办公/教育/研究)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | hugohe3/ppt-master | - | - | Python | AI 从任意文档生成可编辑的 PPTX 文件,真正的 PowerPoint 形状而非图片 |
| 2 | ZhuLinsen/daily_stock_analysis | - | - | Python | LLM 驱动的 A/H/美股智能分析,多数据源行情+实时新闻+LLM 决策仪表盘 |
| 3 | HKUDS/Vibe-Trading | - | - | Python | 个人交易 Agent |
| 4 | HKUDS/AI-Trader | - | - | Python | AI 交易系统 |
| 5 | HKUDS/ViMax | - | - | Python | 可视化最大化工具 |
| 6 | HKUDS/CLI-Anything | - | - | Python | CLI 万物工具 |
| 7 | harry0703/MoneyPrinterTurbo | - | - | Python | AI 视频生成赚钱工具 |
| 8 | Yuan1z0825/nature-skills | - | - | Python | 符合 Nature 论文学术表达和科研绘图的 Skill |
| 9 | JuliusBrussee/caveman | - | - | Python | Caveman 工具 |
| 10 | datawhalechina/easy-vibe | - | - | JavaScript | Datawhale 轻量 Vibe 编程教程 |
| 11 | Wei-Shaw/sub2api | - | - | Go | 订阅转 API 工具 |
| 12 | Tencent/TencentDB-Agent-Memory | - | - | TypeScript | 腾讯云数据库 Agent 记忆系统 |
| 13 | QuantumNous/new-api | - | - | Go | 新 API 管理 |
| 14 | MadsLorentzen/ai-job-search | - | - | TypeScript | AI 驱动的求职框架,基于 Claude Code 构建 |
| 15 | santifer/career-ops | - | - | JavaScript | AI 求职运营工具 |
| 16 | Anil-matcha/Open-Generative-AI | - | - | JavaScript | 开源生成式 AI 集合 |
| 17 | floci-io/floci | - | - | Java | Floci 项目 |
🔧 非 AI 热门 / 基础设施
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | antirez/ds4 | 1,369 | 121 | C | DeepSeek 4 Flash 本地推理引擎,支持 Metal 和 CUDA |
| 2 | D4Vinci/Scrapling | - | - | Python | 智能自适应网页爬虫 |
| 3 | supermemoryai/supermemory | - | - | TypeScript | 极速可扩展的记忆引擎,AI 时代的记忆 API |
| 4 | multica-ai/multica | - | - | TypeScript | Multica AI 项目 |
| 5 | yikart/AiToEarn | - | - | TypeScript | AI 赚钱工具 |
| 6 | ChromeDevTools/chrome-devtools-mcp | - | - | TypeScript | Chrome DevTools MCP 服务 |
| 7 | vercel-labs/zero-native | - | - | Zig | Vercel Zero 原生客户端 |
| 8 | vercel-labs/zero | - | - | C | Vercel Zero 项目 |
| 9 | bytedance/UI-TARS-desktop | - | - | TypeScript | 字节跳动 GUI Agent 桌面版 |
| 10 | Crosstalk-Solutions/project-nomad | - | - | TypeScript | 离线生存计算机,集成关键工具、知识和 AI |
| 11 | manaflow-ai/cmux | - | - | JavaScript | Manaflow CMUX |
| 12 | nexu-io/html-anything | - | - | HTML | HTML 万物工具 |
| 13 | abhigyanpatwari/GitNexus | - | - | TypeScript | Git 关联工具 |
| 14 | lfnovo/open-notebook | - | - | TypeScript | 开放笔记本 |
🎯 月榜核心洞察
- AI Coding Agent 技能大爆发:榜单前 30 名几乎全是 Claude Code / Codex 技能项目,反映 AI 编程助手生态正在高速增长
- Anthropic 官方生态扩张:anthropics/financial-services、anthropics/claude-plugins-official、anthropics/knowledge-work-plugins、anthropics/claude-for-legal 四个官方仓库上榜
- Hermes Agent 生态崛起:NousResearch/hermes-agent (3,576⭐) 位居第 3,多个周边项目上榜(WebUI、Desktop 等)
- antirez/ds4 亮点:Redis 作者 antirez 的 DeepSeek 4 Flash 本地推理引擎,用 C 语言实现,支持 Metal/CUDA
- 知识图谱技能成为新趋势:colbymchenry/codegraph、Lum1104/Understand-Anything、safishamsi/graphify 等多个知识图谱相关项目上榜
- 语言分布:Python (32%)、TypeScript (28%)、Rust (10%)、Shell (6%)、JavaScript (8%)、其他 (16%)
📅 周榜(2026-06-06)
数据来源:OSSInsight Trending | 100 个项目 | 总计 6,441 Stars
按 AI 方向分类:
🤖 AI Coding Agent / AI 编程助手
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | pewdiepie-archdaemon/odysseus | 1,526 | 145 | JavaScript | 自托管 AI 工作区 |
| 2 | chopratejas/headroom | 371 | 15 | Python | 压缩工具输出/日志/RAG 内容,减少 60-95% Token 消耗,保持相同答案质量 |
| 3 | colbymchenry/codegraph | 266 | 6 | TypeScript | 预索引代码知识图谱,支持 Claude Code、Codex、Gemini、Cursor 等 |
| 4 | Lum1104/Understand-Anything | 196 | 9 | TypeScript | 将任何代码转化为可交互的知识图谱,支持多款 AI 编程工具 |
| 5 | Leonxlnx/taste-skill | 136 | 6 | - | 高级前端技能,让 AI 拥有好品味,避免生成无聊的设计 |
| 6 | nesquena/hermes-webui | 136 | 9 | Python | Hermes Agent 的 Web 和手机端最佳使用方式 |
| 7 | rohitg00/ai-engineering-from-scratch | 107 | 12 | Python | 从零开始学 AI 工程:学习、构建、发布 |
| 8 | safishamsi/graphify | 79 | 3 | Python | AI 编程助手技能,将代码/SQL/文档/视频转为可查询知识图谱 |
| 9 | Imbad0202/academic-research-skills | 80 | 7 | Python | Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿 |
| 10 | pbakaus/impeccable | 80 | 3 | JavaScript | 让 AI 工具在设计中表现更好的设计语言 |
| 11 | heygen-com/hyperframes | 77 | 2 | TypeScript | 写 HTML 渲染视频,为 Agent 构建 |
| 12 | MadsLorentzen/ai-job-search | 61 | 13 | TypeScript | AI 驱动的求职框架,基于 Claude Code,自动评估职位、定制简历和面试准备 |
| 13 | Yuan1z0825/nature-skills | 68 | 3 | Python | 符合 Nature 论文学术表达和科研绘图的 Skill |
| 14 | rtk-ai/rtk | 63 | 5 | Rust | CLI 代理,可将常用开发命令的 LLM Token 消耗降低 60-90% |
| 15 | can1357/oh-my-pi | 61 | 4 | TypeScript | 终端 AI 编程 Agent,支持哈希锚定编辑、LSP、Python、浏览器等 |
| 16 | fathah/hermes-desktop | 55 | 6 | TypeScript | Hermes Agent 的桌面伴侣 |
| 17 | revfactory/harness | 57 | 6 | HTML | 设计领域特定 Agent 团队并生成对应技能的元技能 |
| 18 | KKKKhazix/khazix-skills | 54 | 3 | Python | 数字生命卡兹克开源的 AI Skills 合集 |
| 19 | mvanhorn/last30days-skill | 44 | 3 | Python | AI Agent 跨平台研究技能,覆盖 Reddit/X/YouTube/HN/Polymarket 等 |
| 20 | hugohe3/ppt-master | 49 | 7 | Python | AI 从任意文档生成可编辑的 PPTX,真正的 PowerPoint 形状 |
| 21 | mukul975/Anthropic-Cybersecurity-Skills | 47 | 5 | Python | 754 个结构化 AI 网络安全技能,映射 5 大安全框架 |
| 22 | rohitg00/agentmemory | 47 | 2 | TypeScript | 基于实际基准测试排名第一的 AI 编程 Agent 持久记忆 |
| 23 | supermemoryai/supermemory | 83 | 9 | TypeScript | 极速可扩展的 AI 时代记忆引擎和 API |
| 24 | greensock/gsap-skills | 50 | 3 | - | GSAP 官方 AI 技能,教授 AI 编程 Agent 正确使用 GSAP |
| 25 | Crosstalk-Solutions/project-nomad | 44 | 4 | TypeScript | 离线生存计算机,集成关键工具、知识和 AI |
| 26 | tinyhumansai/openhuman | - | - | Rust | 个人 AI 超级智能,私有、简单且强大 |
| 27 | CloakHQ/CloakBrowser | - | - | Python | 隐身 Chromium 浏览器,通过所有机器人检测测试 |
| 28 | datawhalechina/hello-agents | - | - | Python | 《从零开始构建智能体》—— 原理与实践教程 |
| 29 | shareAI-lab/learn-claude-code | - | - | Python | Claude Code 学习教程 |
| 30 | Alishahryar1/free-claude-code | - | - | Python | 免费 Claude Code 使用方案 |
| 31 | tashfeenahmed/freellmapi | - | - | TypeScript | 免费 LLM API 访问 |
| 32 | Hmbown/CodeWhale | - | - | Rust | 面向开源模型的编程 Agent |
| 33 | garrytan/gbrain | - | - | TypeScript | Garry Tan 的 AI 大脑工具 |
| 34 | op7418/guizang-ppt-skill | - | - | HTML | 归藏 PPT 生成技能 |
| 35 | EveryInc/compound-engineering-plugin | - | - | TypeScript | 复合工程插件 |
| 36 | decolua/9router | - | - | JavaScript | 免费 AI 编程无限使用,连接多款工具到免费 API |
| 37 | anthropics/financial-services | - | - | Python | Anthropic 官方金融服务技能 |
| 38 | multica-ai/multica | - | - | TypeScript | Multica AI 项目 |
| 39 | addyosmani/agent-skills | - | - | Shell | 生产级 AI 编程 Agent 工程技能 |
| 40 | alchaincyf/nuwa-skill | - | - | Python | 女娲 AI 编程技能 |
| 41 | alchaincyf/huashu-design | - | - | HTML | 华数设计技能 |
| 42 | anthropics/knowledge-work-plugins | - | - | Python | Anthropic 官方知识工作插件 |
| 43 | AgriciDaniel/claude-seo | - | - | Python | Claude SEO 技能 |
| 44 | shanraisshan/claude-code-best-practice | - | - | HTML | Claude Code 最佳实践 |
| 45 | HKUDS/CLI-Anything | - | - | Python | CLI 万物工具 |
| 46 | rmyndharis/OpenWA | - | - | TypeScript | OpenWA 工具 |
| 47 | K-Dense-AI/scientific-agent-skills | - | - | Python | 科研 Agent 技能 |
| 48 | manaflow-ai/cmux | - | - | JavaScript | Manaflow CMUX |
| 49 | abhigyanpatwari/GitNexus | - | - | TypeScript | Git 关联工具 |
| 50 | ConardLi/garden-skills | - | - | CSS | 前端花园技能集 |
| 51 | router-for-me/CLIProxyAPI | - | - | Go | CLI 代理 API |
| 52 | VoltAgent/awesome-agent-skills | - | - | - | Agent 技能精选 |
| 53 | Tencent/TencentDB-Agent-Memory | - | - | TypeScript | 腾讯云数据库 Agent 记忆系统 |
| 54 | vectorize-io/hindsight | - | - | Python | Hindsight 回溯工具 |
| 55 | millionco/react-doctor | - | - | TypeScript | React 诊断工具 |
| 56 | nexu-io/html-anything | - | - | HTML | HTML 万物工具 |
| 57 | crynta/terax-ai | - | - | TypeScript | Terax AI |
🧠 AI Agent 框架与平台
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | unicity-astrid/astrid | 287 | 0 | Rust | 面向 AI Agent 的操作系统 |
| 2 | ogulcancelik/herdr | - | - | Rust | Herdr Agent 工具 |
| 3 | AlexsJones/llmfit | - | - | Rust | LLM 适配工具 |
| 4 | openclaw/openclaw-windows-node | - | - | C# | OpenClaw Windows 节点 |
| 5 | mindfold-ai/Trellis | - | - | TypeScript | Trellis AI 框架 |
| 6 | reconurge/flowsint | - | - | TypeScript | Flowsint 工具 |
| 7 | 0-AI-UG/cate | - | - | TypeScript | Cate AI 工具 |
| 8 | microsoft/agent-governance-toolkit | - | - | Python | 微软 Agent 治理工具包 |
🗣️ AI 语音/多模态
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | OpenBMB/VoxCPM | 119 | 8 | Python | VoxCPM2:无分词器的多语言 TTS,支持声音设计和克隆 |
| 2 | Open-LLM-VTuber/open-LLM-VTuber | 73 | 5 | Python | 与任意 LLM 免手式语音交互,支持 Live2D |
| 3 | debpalash/OmniVoice-Studio | - | - | Python | 全能语音工作室 |
| 4 | echo-loop/Echo-Loop | - | - | Dart | Echo Loop 语音工具 |
| 5 | microsoft/VibeVoice | - | - | Python | 微软 VibeVoice 语音工具 |
| 6 | AIDC-AI/Pixelle-Video | - | - | Python | 视频生成/编辑 AI 工具 |
💡 AI 应用(金融/办公/教育/研究)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | ZhuLinsen/daily_stock_analysis | 51 | 32 | Python | LLM 驱动的 A/H/美股智能分析,零成本定时运行 |
| 2 | HKUDS/Vibe-Trading | 55 | 8 | Python | 个人交易 Agent |
| 3 | datawhalechina/easy-vibe | - | - | JavaScript | Datawhale 轻量 Vibe 编程教程 |
| 4 | datawhalechina/Agent-Learning-Hub | - | - | HTML | Datawhale Agent 学习中心 |
| 5 | p-e-w/heretic | - | - | Python | Heretic 项目 |
| 6 | shiyu-coder/Kronos | - | - | Python | Kronos 时间工具 |
| 7 | Wei-Shaw/sub2api | - | - | Go | 订阅转 API 工具 |
| 8 | MaxMiksa/Auto-Company | - | - | Python | 自动公司 Agent |
| 9 | FareedKhan-dev/train-llm-from-scratch | - | - | Jupyter Notebook | 从零训练 LLM 教程 |
| 10 | lfnovo/open-notebook | - | - | TypeScript | 开放笔记本 |
| 11 | nashsu/llm_wiki | - | - | TypeScript | LLM 百科 |
| 12 | koala73/worldmonitor | - | - | TypeScript | 世界监控工具 |
| 13 | wbh604/UZI-Skill | - | - | Python | UZI 技能 |
🔧 非 AI 热门 / 基础设施
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | thcp/stemdeck | - | - | JavaScript | Stemdeck 工具 |
| 2 | opensquilla/opensquilla | - | - | Python | OpenSquilla 开源项目 |
| 3 | opendataloader-project/opendataloader-pdf | - | - | Java | 开放数据加载器 PDF |
| 4 | getpaseo/paseo | - | - | TypeScript | Paseo 项目 |
| 5 | run-llama/liteparse | - | - | Rust | LlamaIndex 轻量解析器 |
| 6 | iOfficeAI/OfficeCLI | - | - | C# | 办公 AI CLI |
| 7 | webadderallorg/Recordly | - | - | TypeScript | Recordly 记录工具 |
| 8 | withastro/flue | - | - | TypeScript | Astro Flue 项目 |
| 9 | Leey21/awesome-ai-research-writing | - | - | - | AI 研究写作精选 |
| 10 | helloianneo/ian-xiaohei-illustrations | - | - | - | 小黑插画 |
| 11 | JCodesMore/ai-website-cloner-template | - | - | TypeScript | AI 网站克隆模板 |
| 12 | vercel-labs/skills | - | - | TypeScript | Vercel 官方 AI 技能 |
| 13 | blader/humanizer | - | - | - | Humanizer 人性化工具 |
| 14 | codebymitch/TitanBot | - | - | JavaScript | TitanBot 机器人 |
| 15 | darrylmorley/whatcable | - | - | Swift | WhatCable 线缆识别工具 |
| 16 | github/app | - | - | - | GitHub App |
🎯 周榜核心洞察
与 GitHub Trending 的对比
- OSSInsight 周榜以 AI Coding Agent 技能 为绝对主流(占比约 60%),与 GitHub Trending 有大量重叠
- GitHub Trending 更多关注大型基础设施项目,而 OSSInsight 更偏重 社区活跃度驱动的小型技能项目
- 大量项目为 Claude Code / Codex 的 Skill 文件,反映了 AI 编程助手生态的爆发式增长
OSSInsight 独家发现的项目
- unicity-astrid/astrid:AI Agent 操作系统(Rust),概念独特
- OpenBMB/VoxCPM:无分词器的多语言 TTS 系统,中文团队项目
- microsoft/VibeVoice:微软的语音交互项目
- microsoft/agent-governance-toolkit:微软 Agent 治理工具包
- Tencent/TencentDB-Agent-Memory:腾讯云数据库 Agent 记忆系统
- openclaw/openclaw-windows-node:OpenClaw Windows 节点
- datawhalechina/hello-agents:Datawhale 智能体教程
- ZhuLinsen/daily_stock_analysis:LLM 驱动的 A/H/美股智能分析
语言分布趋势
- Python (30%):AI 技能和教育项目的首选语言
- TypeScript (28%):Agent 工具和 Web UI 的主力
- Rust (10%):高性能 Agent 和系统工具,增长迅速
- JavaScript (8%):Web 和自动化工具
- Shell (5%):配置和技能文件
- 其他:Go、Java、C#、Dart、Zig、C、C++ 等
关键趋势
- AI Skill 经济:Claude Code / Codex 技能项目占据榜单半壁江山,形成新的开源生态
- Agent 记忆与持久化:rohitg00/agentmemory、supermemoryai/supermemory、Tencent/TencentDB-Agent-Memory 等多个项目关注 Agent 记忆
- 知识图谱:codegraph、Understand-Anything、graphify 等知识图谱工具成为热门方向
- 中国团队活跃:datawhalechina、Tencent、OpenBMB、HKUDS 等多个中国团队项目上榜
🤗 Hugging Face Trending Models
采集时间:2026-06-06 05:33 CST | 数据源:HF Trending Models
| # | 模型 | 任务 | 参数量 | 下载量 | 点赞 | 亮点 |
|---|---|---|---|---|---|---|
| 1 | nvidia/LocateAnything-3B | 图文转文本 | 4B | 102k | 1.37k | NVIDIA 定位万物模型,视觉定位能力突出 |
| 2 | google/gemma-4-12B-it | 多模态 | 12B | 143k | 537 | Google Gemma 4 指令微调版,支持多模态输入 |
| 3 | unsloth/gemma-4-12b-it-GGUF | 图文转文本 | 12B | 296k | 365 | Gemma 4 GGUF 量化版,适配本地部署 |
| 4 | HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive | 图文转文本 | 35B | 2.69M | 1.45k | Qwen3.6 无审查版,激进去安全对齐,下载量极高 |
| 5 | google/gemma-4-12B | 多模态 | 12B | 53.5k | 332 | Gemma 4 基座模型,开源多模态 |
| 6 | LiquidAI/LFM2.5-8B-A1B | 文本生成 | 8B | 82.7k | 526 | LiquidAI 新架构语言模型,1小时前刚更新 |
| 7 | sapientinc/HRM-Text-1B | 文本生成 | 1B | 159k | 702 | 超轻量文本模型,下载量表现亮眼 |
| 8 | ideogram-ai/ideogram-4-fp8 | 文本转图像 | — | 1.25k | 267 | Ideogram 4 图像生成 fp8 量化版 |
| 9 | JetBrains/Mellum2-12B-A2.5B-Thinking | 文本生成 | 12B | 14.7k | 221 | JetBrains 代码模型,带思维链推理能力 |
| 10 | stepfun-ai/Step-3.7-Flash | 图文转文本 | 201B | 27.9k | 330 | 阶跃星辰 Step 3.7 Flash,超大参数多模态模型 |
| 11 | openbmb/MiniCPM5-1B | 文本生成 | 1B | 91.2k | 770 | 面壁智能 MiniCPM5,端侧小模型新标杆 |
| 12 | ideogram-ai/ideogram-4-nf4 | 文本转图像 | — | 1.59k | 190 | Ideogram 4 极低比特量化版 |
| 13 | nvidia/Qwen3.6-35B-A3B-NVFP4 | 文本生成 | 19B | 822k | 189 | NVIDIA 量化版 Qwen3.6,MoE 架构激活参数仅3B |
| 14 | nvidia/Cosmos3-Nano | — | 16B | 21.6k | 176 | NVIDIA Cosmos3 世界模型 Nano 版 |
| 15 | deepseek-ai/DeepSeek-V4-Pro | 文本生成 | 862B | 5.56M | 4.66k | DeepSeek V4 旗舰版,超大规模 MoE,点赞数断层领先 |
| 16 | nvidia/nemotron-3.5-asr-streaming-0.6b | 语音识别 | — | 597 | 188 | NVIDIA 流式语音识别模型,支持实时推理 |
| 17 | nvidia/Cosmos3-Super | — | 65B | 19.2k | 142 | NVIDIA Cosmos3 世界模型 Super 版 |
| 18 | PaddlePaddle/PaddleOCR-VL-1.6 | 图文转文本 | 1.0B | 6.88k | 244 | 百度飞桨 OCR 视觉语言模型,12小时前更新 |
| 19 | ByteDance/Bernini-R | 图文转视频 | — | 175 | 138 | 字节跳动图生视频模型 |
| 20 | nvidia/PiD | 图像转图像 | — | 901 | 310 | NVIDIA 图像处理模型 |
🎯 核心洞察
参数量分布趋势
- 小模型(<10B)霸榜:Top 20 中有 8 个模型参数量 ≤10B(1B×3, 4B, 5B, 8B, 9B, 16B),端侧部署是明确趋势
- 超大模型仍有市场:DeepSeek-V4-Pro(862B)、Step-3.7-Flash(201B)、Nemotron-3-Ultra(561B)证明旗舰模型仍有强需求
- MoE 架构流行:Qwen3.6-35B-A3B、LFM2.5-8B-A1B、DeepSeek-V4 系列均采用 MoE,以较少激活参数实现高性能
任务类型分布
- 文本生成/语言模型(6个):仍是主力赛道
- 多模态(图文理解/生成)(7个):Any-to-Any、Image-Text-to-Text 成为主流
- 图像生成(3个):Ideogram 4 系列、Cosmos3 Text2Image
- 视频生成(2个):Sulphur-2、Bernini-R
- 语音(2个):TTS 和 ASR 各一
- 世界模型(2个):NVIDIA Cosmos3 系列异军突起
厂商格局
- NVIDIA 占据主导:Top 20 中占据 8 个席位(LocateAnything、Qwen3.6量化版、Cosmos3×3、Nemotron×2、PiD),从训练到推理全链路布局
- 国产模型强劲:DeepSeek V4 系列点赞断层领先,阶跃星辰 Step-3.7-Flash、面壁 MiniCPM5、百度 PaddleOCR-VL、字节 Bernini-R 均上榜,共占 6 席(30%)
- Google Gemma 4 刚发布即爆发:12B 模型及其 GGUF 量化版同时上榜
热点趋势
- 量化模型需求旺盛:fp8、nf4、GGUF、NVFP4 等量化版本频繁出现,本地部署需求强劲
- 无审查模型关注度极高:Qwen3.6 无审查版下载量达 269 万,反映社区对去安全对齐的强烈需求
- 世界模型成为新赛道:NVIDIA Cosmos3 系列三个变体同时上榜,物理世界模拟是新兴方向
📄 Hugging Face Trending Papers
采集时间:2026-06-06 05:39 CST | 数据源:HF Trending + 6月月榜
📅 月榜 Top 20(2026年6月)
| # | 论文标题 | 👍 | 方向 | 作者/机构 | GitHub ⭐ | 亮点 |
|---|---|---|---|---|---|---|
| 1 | Crafter: A Multi-Agent Harness for Editable Scientific Figure Generation from Diverse Inputs(Crafter:面向多源输入的可编辑科学图表生成多智能体框架) | 189 | 多智能体 / 科学图表生成 | Liang Chen, Zheng Wang 等(9位作者) | 85 | 多智能体协作生成可编辑科学图表,支持多样化输入格式 |
| 2 | On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters(参数高效微调的规模化:迈向万亿参数百万个性化模型) | 174 | 参数高效微调 / 个性化模型 | Mind Lab(韩国) | — | 探索万亿参数模型的百万级个性化 PEFT 方案,极限扩展 |
| 3 | Domino: Decoupling Causal Modeling from Autoregressive Drafting in Speculative Decoding(Domino:推测解码中因果建模与自回归草稿的解耦) | 139 | 推测解码 / 推理加速 | 上海交通大学(SJTU) | 42 | 解耦因果建模与自回归起草,大幅提升推理速度 |
| 4 | COLLEAGUE.SKILL: Automated AI Skill Generation via Expert Knowledge Distillation(COLLEAGUE.SKILL:基于专家知识蒸馏的自动化AI技能生成) | 105 | AI智能体技能 / 知识蒸馏 | 上海AI实验室(Shanghai AI Lab) | 19k | 从异构轨迹自动蒸馏AI技能,可检查可纠正 |
| 5 | GrepSeek: Training Search Agents for Direct Corpus Interaction(GrepSeek:训练搜索智能体直接与语料库交互) | 102 | 搜索智能体 / 信息检索 | 马萨诸塞大学阿默斯特分校(UMass Amherst) | 36 | 训练搜索智能体直接与语料库交互,绕过传统检索瓶颈 |
| 6 | Audio Interaction Model(音频交互模型) | 99 | 多模态音频 / 流式交互 | 新加坡国立大学(NUS) | 103 | 统一流式音频模型,支持离线任务执行与实时音频指令跟随 |
| 7 | Cosmos 3: Omnimodal World Models for Physical AI(Cosmos 3:面向物理AI的全模态世界模型) | 83 | 世界模型 / 全模态 | NVIDIA | 9.37k | 混合Transformer统一架构处理和生成多种数据类型 |
| 8 | OCC-RAG: Optimal Cognitive Core for Faithful Question Answering(OCC-RAG:面向忠实问答的最优认知核心) | 83 | RAG / 问答系统 | OCC AI | 23 | 最优认知核心提升RAG系统忠实度 |
| 9 | Trust-Region Behavior Blending for On-Policy Distillation(基于信赖域的行为混合策略蒸馏) | 64 | 模型蒸馏 / 策略优化 | T-Tech(TikTok/字节跳动) | 4 | 信赖域方法实现策略蒸馏,保持行为一致性 |
| 10 | A Matter of TASTE: Improving Coverage and Difficulty of Agent Benchmarks(TASTE:提升智能体基准测试的覆盖率和难度) | 63 | 智能体评测 / 基准测试 | 以色列理工学院(Technion) | 4 | 提出更全面的智能体评测方法,覆盖更多任务难度 |
| 11 | Masking Stale Observations Helps Search Agents – Until It Doesn’t(遮蔽过时观测有助于搜索智能体——但也有极限) | 60 | 搜索智能体 / 优化策略 | McAuley Lab(UCSD) | — | 揭示遮蔽过时观测对搜索智能体的双重效应 |
| 12 | Representation Forcing for Bottleneck-Free Unified Multimodal Models(面向无瓶颈统一多模态模型的表征强制) | 57 | 多模态模型 / 表征学习 | 字节跳动Seed(ByteDance-Seed) | — | 消除多模态模型信息瓶颈,统一架构 |
| 13 | SwanVoice: Expressive Long-Form Zero-Shot Speech Synthesis(SwanVoice:富有表现力的长文本零样本语音合成) | 56 | 语音合成 / 零样本 | 字节跳动(ByteDance) | — | 零样本长文本富有表现力的语音合成 |
| 14 | K-BrowseComp: A Web Browsing Agent Benchmark Grounded in Korean Contexts(K-BrowseComp:基于韩语语境的网页浏览智能体基准) | 52 | 智能体评测 / 网页浏览 | 卡内基梅隆大学(CMU) | — | 韩语语境下的网页浏览智能体评测基准 |
| 15 | Mellum2 Technical Report(Mellum2 技术报告) | 52 | 代码模型 / LLM | JetBrains | — | JetBrains新一代代码大模型 |
| 16 | From Activation to Causality: Discovery of Causal Visual Representations in the Human Brain(从激活到因果:人脑因果视觉表征的发现) | 51 | 神经科学 / 视觉表征 | 麻省理工学院(MIT) | — | 揭示人脑中的因果视觉表征机制 |
| 17 | KVarN: Variance-Normalized KV-Cache Quantization(KVarN:方差归一化KV缓存量化) | 50 | KV缓存量化 / 推理优化 | 华为(Huawei CSL) | 284 | 无标定KV缓存量化器,减少推理误差累积 |
| 18 | Where Do Deep-Research Agents Go Wrong? Span-Level Error Localization(深度研究智能体错在哪?跨度级错误定位) | 49 | 智能体诊断 / 深度研究 | 南京大学 NJU-LINK | — | 定位深度研究智能体的错误位置 |
| 19 | Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses(Harness-1:面向搜索智能体的强化学习状态外化框架) | 42 | 搜索智能体 / 强化学习 | ChromaDB | — | 强化学习驱动的搜索智能体,状态外化提升效果 |
| 20 | Trust Region On-Policy Distillation(信赖域在线策略蒸馏) | 41 | 模型蒸馏 / 策略优化 | 三星研究院(Samsung Research) | — | 信赖域方法实现高效策略蒸馏 |
📅 月榜 21-50(精选)
| # | 论文标题 | 👍 | 方向 | 作者/机构 | 亮点 |
|---|---|---|---|---|---|
| 21 | GGT-100K: Generative Ground Truth for Generalizable Real-World Image Restoration(GGT-100K:面向通用真实世界图像修复的生成式真值) | 41 | 图像修复 / 数据集 | 香港理工大学 VCLab | 10万生成式图像修复真值数据集 |
| 22 | LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories(LongTraceRL:从搜索智能体轨迹学习长上下文推理) | 41 | 长上下文推理 / RL | 清华大学 KEG | 基于评分奖励从搜索轨迹学习长上下文推理 |
| 23 | ArcANE: Do Role-Playing Language Agents Stay in Character at the Right Time?(ArcANE:角色扮演语言智能体是否在正确时间保持角色?) | 40 | 角色扮演智能体 / 评测 | 首尔国立大学 | 评测角色扮演智能体的角色保持能力 |
| 24 | Function2Scene: 3D Indoor Scene Layout from Functional Specifications(Function2Scene:从功能规格生成3D室内场景布局) | 40 | 3D场景生成 | — | 功能驱动的3D室内场景布局生成 |
| 25 | Code2LoRA: Hypernetwork-Generated Adapters for Code Language Models(Code2LoRA:超网络生成代码模型适配器) | 39 | 代码模型 / 适配器 | 滑铁卢大学(UWaterloo) | 超网络自动生成代码模型LoRA适配器 |
| 26 | Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking(Humanoid-GPT:零样本运动跟踪的数据与结构扩展) | 38 | 人形机器人 / 运动跟踪 | — | 大规模数据驱动零样本人形运动跟踪 |
| 27 | Reproducing, Analyzing, and Detecting Reward Hacking in Rubric-Based RL(基于评分标准的强化学习奖励作弊复现、分析与检测) | 37 | RLHF / 奖励作弊 | — | 系统性分析强化学习中的奖励作弊问题 |
| 28 | Towards Streaming Synchronized Spatial Audio Generation(面向流式同步空间音频生成) | 36 | 音频生成 / 流式推理 | 浙江大学(ZJU) | 自回归扩散Transformer实现流式空间音频 |
| 29 | dMoE: dLLMs with Learnable Block Experts(dMoE:可学习块专家的扩散语言模型) | 36 | 扩散语言模型 / MoE | — | 扩散语言模型与可学习块专家混合 |
| 30 | SANA-Streaming: Real-time Streaming Video Editing with Hybrid Diffusion Transformer(SANA-Streaming:混合扩散Transformer实时流式视频编辑) | 36 | 视频编辑 / 流式推理 | NVIDIA | 混合扩散架构实现实时流式视频编辑 |
| 31 | TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration(TIDE:模板引导迭代式主动多问题发现) | 35 | 智能体 / 问题发现 | KAIST AI | 模板引导的主动多问题发现框架 |
| 32 | Task-Focused Memorization for Multimodal Agents(面向任务的多模态智能体记忆) | 33 | 多模态智能体 / 记忆 | 字节跳动Seed | 任务导向的多模态智能体记忆机制 |
| 33 | NITP: Next Implicit Token Prediction for LLM Pre-training(NITP:LLM预训练的下一代隐式Token预测) | 33 | LLM预训练 / Token预测 | 上海交通大学 SAI | 隐式Token预测提升LLM预训练效果 |
| 34 | X-Stream: Exploring MLLMs as Multiplexers for Multi-Stream Understanding(X-Stream:多模态LLM作为多流理解的多路复用器) | 32 | 多模态理解 / 流式处理 | — | 将MLLM作为多流理解的多路复用器 |
| 35 | Qwen-Image-Flash: Beyond Objective Design(Qwen-Image-Flash:超越目标设计) | 30 | 视觉语言模型 | Qwen(阿里通义) | 通义千问图像Flash版本 |
| 36 | World Models Meet Language Models: On the Complementarity of Concrete and Abstract Reasoning(世界模型遇上语言模型:具体与抽象推理的互补性) | 29 | 世界模型 / 推理 | 腾讯(Tencent) | 探索世界模型与语言模型的推理互补性 |
| 37 | VLMs are Good Teachers for Video Reasoning via Adaptive Test-Time Optimization(VLM通过自适应测试时优化教导视频推理) | 29 | 视频推理 / 测试时优化 | 快手 KlingTeam | VLM作为教师指导视频推理 |
| 38 | AutoLab: Can Frontier Models Solve Long-Horizon Auto Research and Engineering Tasks?(AutoLab:前沿模型能否解决长周期自动研究与工程任务?) | 26 | 自动化研究 / 智能体 | — | 评测前沿模型在长周期自动研究任务中的能力 |
| 39 | VideoMLA: Low-Rank Latent KV Cache for Minute-Scale Autoregressive Video Diffusion(VideoMLA:面向分钟级自回归视频扩散的低秩潜在KV缓存) | 26 | 视频生成 / KV缓存优化 | — | 低秩潜在KV缓存实现分钟级视频扩散 |
| 40 | VLM3: Vision Language Models Are Native 3D Learners(VLM3:视觉语言模型天生就是3D学习者) | 25 | 3D理解 / VLM | Meta FAIR | 简单架构修改让VLM原生支持3D理解 |
| 41 | Streaming Communication in Multi-Agent Reasoning(多智能体推理中的流式通信) | 25 | 多智能体 / 流式推理 | — | 流式中间结果传递提升多智能体推理效率 |
| 42 | Echo-Infinity: Learning Evolving Memory for Real-Time Infinite Video Generation(Echo-Infinity:实时无限视频生成的可学习进化记忆) | 25 | 视频生成 / 无限生成 | — | 可学习进化记忆实现实时无限视频生成 |
| 43 | ThoughtFold: Folding Reasoning Chains via Introspective Preference Learning(ThoughtFold:通过内省偏好学习折叠推理链) | 24 | 推理优化 / 偏好学习 | InternLM(上海AI实验室) | 内省偏好学习压缩推理链 |
| 44 | SAAS: Self-Aware Reinforcement Learning for Over-Search Mitigation(SAAS:面向过度搜索缓解的自我感知强化学习) | 24 | 智能体搜索 / RL | 厦门大学(XMU) | 自我感知RL缓解智能体过度搜索 |
| 45 | Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories(语言模型需要睡眠:学习自我修改和巩固记忆) | 23 | 记忆机制 / 持续学习 | 类睡眠机制让LLM自我修改和巩固记忆 |
🔥 Trending 热门论文(跨月累计高星)
| # | 论文标题 | 👍 | 方向 | GitHub ⭐ | 亮点 |
|---|---|---|---|---|---|
| 1 | TradingAgents: Multi-Agents LLM Financial Trading Framework(TradingAgents:多智能体LLM金融交易框架) | 86 | 金融交易 / 多智能体 | 83.1k | 🔥 模拟真实交易公司的多智能体LLM股票交易框架 |
| 2 | PaddleOCR-VL-1.6: Expanding the Frontier of Document Parsing(PaddleOCR-VL-1.6:拓展文档解析前沿) | 13 | 文档解析 / OCR | 80.3k | 🔥 百度PaddleOCR视觉语言版,文档解析SOTA |
| 3 | Efficient Memory Management for Large Language Model Serving with PagedAttention(PagedAttention:LLM服务高效内存管理) | 58 | LLM推理 / 内存管理 | 82k | 🔥 vLLM核心PagedAttention算法,KV缓存高效管理 |
| 4 | LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models(LlamaFactory:100+语言模型统一高效微调) | 183 | 模型微调 / 工具 | 71.9k | 🔥 统一微调框架,Web界面支持100+模型 |
| 5 | DataFlow: An LLM-Driven Framework for Unified Data Preparation(DataFlow:LLM驱动的统一数据准备框架) | 222 | 数据工程 / 自动化 | 4.56k | 🔥 LLM驱动数据质量提升与自动化流水线 |
| 6 | SkillOpt: Executive Strategy for Self-Evolving Agent Skills(SkillOpt:自进化智能体技能的执行策略) | 221 | 智能体技能 / 自进化 | 5.06k | 🔥 微软出品,文本空间技能优化器,零推理开销 |
| 7 | WebWatcher: Breaking New Frontier of Vision-Language Deep Research Agent(WebWatcher:视觉语言深度研究智能体新突破) | 143 | 深度研究 / 多模态智能体 | 19.3k | 阿里巴巴出品,视觉语言深度研究智能体 |
| 8 | VibeVoice Technical Report(VibeVoice技术报告) | 171 | 语音合成 / 多说话人 | 48.2k | 微软出品,下一token扩散+连续语音分词器 |
| 9 | MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing(MinerU2.5:高效高分辨率文档解析解耦视觉语言模型) | 165 | 文档解析 / VLM | 66.6k | 1.2B参数的轻量文档解析VLM,粗到细策略 |
| 10 | SmolDocling: An Ultra-Compact Vision-Language Model for End-to-End Multi-Modal Document Conversion(SmolDocling:端到端多模态文档转换的超紧凑VLM) | 161 | 文档转换 / VLM | 61k | IBM出品,仅256M参数的端到端文档转换模型 |
| 11 | ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration(ARIS:对抗式多智能体协作的自主研究) | 127 | 自动化研究 / 多智能体 | 11.5k | 上海交大出品,跨模型对抗协作实现可靠研究 |
| 12 | Scaling Agents via Continual Pre-training(通过持续预训练扩展智能体) | 117 | 智能体预训练 / 持续学习 | 19.3k | 阿里巴巴AgentFounder,智能体持续预训练SOTA |
| 13 | COLLEAGUE.SKILL: Automated AI Skill Generation(COLLEAGUE.SKILL:自动化AI技能生成) | 105 | 智能体技能 / 知识蒸馏 | 19k | 上海AI实验室,异构轨迹蒸馏AI技能 |
| 14 | Kronos: A Foundation Model for the Language of Financial Markets(Kronos:金融市场语言基础模型) | 38 | 金融AI / 时序预测 | 28.6k | 金融K线数据专用预训练框架 |
| 15 | LightRAG: Simple and Fast Retrieval-Augmented Generation(LightRAG:简单快速的检索增强生成) | 39 | RAG / 知识图谱 | 36.2k | 图结构增强的RAG系统 |
| 16 | Zep: A Temporal Knowledge Graph Architecture for Agent Memory(Zep:智能体记忆的时序知识图谱架构) | 11 | 智能体记忆 / 知识图谱 | 27k | 时序知识图谱架构的智能体记忆层 |
| 17 | AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications(AgentScope 1.0:开发者导向的智能体应用框架) | 64 | 智能体框架 / 开发工具 | 26.2k | 阿里巴巴达摩院,ReAct范式智能体开发框架 |
| 18 | OpenDevin: An Open Platform for AI Software Developers(OpenDevin:AI软件开发者开放平台) | 79 | AI编程 / 智能体 | 75.9k | 开源AI编程智能体平台 |
| 19 | DFlash: Block Diffusion for Flash Speculative Decoding(DFlash:用于闪速推测解码的块扩散) | 82 | 推测解码 / 推理加速 | 4.94k | 块扩散模型并行Token起草,显著推理加速 |
| 20 | Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models(YOLO26:统一实时端到端视觉模型) | 5 | 目标检测 / 实时视觉 | 58k | 最新YOLO版本,无NMS推理+多任务统一 |
🎯 核心洞察
🏢 机构分布(中国 vs 海外)
| 机构类型 | 代表机构 | 论文数量(约) |
|---|---|---|
| 🇨🇳 中国 | 上海AI实验室、上海交大、清华、浙大、北大、南京大学、字节跳动、阿里巴巴、华为、百度、腾讯、快手、厦门大学、复旦 | ~50% |
| 🇺🇸 美国 | NVIDIA、微软研究院、MIT、CMU、Meta FAIR、Google、UCLA、斯坦福、UIUC | ~30% |
| 🌏 其他 | 新加坡国立大学、KAIST(韩国)、首尔国立大学、以色列理工、ETH苏黎世、华为 | ~20% |
关键观察:
- 🇨🇳 中国机构贡献占比极高,尤其在智能体技能(SkillOpt/COLLEAGUE)、蒸馏(Domino)、文档解析(PaddleOCR/MinerU)领域表现突出
- 🇺🇸 NVIDIA 凭借 Cosmos 3、SANA-Streaming、GRAIL 等多篇文章强势占据世界模型/视频生成赛道
- 🇨🇳 字节跳动(ByteDance + Seed)在多模态模型、语音合成、视频生成多条线并行推进
🔬 研究方向热度排行
| 排名 | 方向 | 论文数 | 代表论文 |
|---|---|---|---|
| 1 | 🤖 AI智能体(技能/搜索/研究/评测) | ~25 | SkillOpt, COLLEAGUE.SKILL, GrepSeek, ARIS, AutoLab |
| 2 | 🎥 视频生成与理解 | ~10 | Cosmos 3, SANA-Video, Echo-Infinity, LongCat-Video |
| 3 | 🧠 模型蒸馏与推理加速 | ~8 | Domino, DFlash, Trust-Region Distillation, KVarN |
| 4 | 📄 文档解析与OCR | ~5 | PaddleOCR-VL-1.6, MinerU2.5, SmolDocling |
| 5 | 🗣️ 语音与音频生成 | ~5 | VibeVoice, SwanVoice, Audio Interaction, MOSS-TTS |
| 6 | 🧩 RAG与知识增强 | ~4 | OCC-RAG, LightRAG, Zep |
| 7 | 💰 金融AI | ~3 | TradingAgents, Kronos, AI-Trader |
| 8 | 🏗️ 世界模型 | ~3 | Cosmos 3, minWM, stable-worldmodel |
关键趋势:
- 🔥 智能体技能自进化 成为6月最热门方向(SkillOpt 221👍、COLLEAGUE 105👍、DataFlow 222👍)
- 🔥 推测解码与推理加速 持续升温,多篇蒸馏/量化/并行解码论文上榜
- 🔥 视频生成从”能生成”到”实时+无限+交互” 演进(Echo-Infinity、SANA-Streaming、minWM)
- 📈 长上下文推理 成为RL新战场(LongTraceRL、SAAS)
📊 论文→GitHub 转化率 TOP 10
| 论文 | 👍 | GitHub ⭐ | 转化比 |
|---|---|---|---|
| TradingAgents | 86 | 83.1k | 967x |
| LlamaFactory | 183 | 71.9k | 393x |
| Kronos | 38 | 28.6k | 753x |
| AgentScope | 64 | 26.2k | 409x |
| VibeVoice | 171 | 48.2k | 282x |
| DataFlow | 222 | 4.56k | 21x |
| SkillOpt | 221 | 5.06k | 23x |
| MinerU2.5 | 165 | 66.6k | 404x |
| SmolDocling | 161 | 61k | 379x |
| ARIS | 127 | 11.5k | 91x |
洞察:
- 工具型项目(TradingAgents、LlamaFactory、Kronos)转化率极高,开发者社区需求旺盛
- 研究型论文(DataFlow、SkillOpt)点赞多但Star相对低,学术热度 > 工程落地
- 文档解析赛道(MinerU、SmolDocling、PaddleOCR)转化率稳定,说明行业刚需强劲
🔥 Hacker News AI 热帖
搜索范围: 4 个搜索词(”AI agent” / “AI coding LLM” / “AI open source model” / “AI tool”)× pastMonth,合并去重后 7 条
📅 月榜
🏆 Tier 1 — 超级爆款(200+ points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 611 | Uber 每月 1500 美元的 AI 使用上限,是 AI 工具定价的有用信号 | 文章 | 760 | Uber 限制员工 AI 工具月支出上限 $1500,Simon Willison 分析这折射出企业级 AI 工具定价的真实困境——Claude Code 等工具按 token 计费让成本失控 |
| 501 | 斯坦福 CS336 课程 AI Agent 指南 | 文章 | 153 | 斯坦福深度学习课程发布的 CLAUDE.md 文件,详细规定了学生使用 AI Agent(如 Claude)完成作业的准则,引发教育界 AI 使用边界大讨论 |
| 386 | Show HN: Continue? Y/N — 一款关于 AI Agent 权限疲劳的 60 秒小游戏 | Show HN | 162 | 极具创意的互动游戏,模拟不断点击 “允许/拒绝” 来体验 AI Agent 持续请求权限的疲劳感,直击 AI Agent 用户体验痛点 |
| 380 | AI 编程 Agent 写的代码,必须降低你的维护成本 | 文章 | 108 | James Shore 的深度文章,论证 AI coding agent 的价值不在于写更多代码,而在于降低维护负担;否则只是加速制造技术债 |
| 251 | 亚马逊员工因 AI 工具使用压力开始「Token 刷量」 | 新闻 | 253 | 亚马逊内部强制推广 AI 工具,员工为达标而 “tokenmaxxing”——用 AI 生成不必要的内容消耗 token,暴露企业 AI 推广的荒诞现实 |
🥈 Tier 3 — 中等热度(40-100 points)
无
🥉 Tier 4 — 值得关注(<40 points,新品/有趣项目)
- [22 pts] 本地 AI 编程工具:JSON AST 到 Clojure 的转换 — Show HN — 小众但有趣的本地 LLM 编程工具,将 JSON AST 转换为 Clojure 代码
- [7 pts] Airbnb CEO 称美国对中国开源 AI 模型的使用存在「误解」 — 新闻 — Airbnb CEO Chesky 公开表示美国对中国开源模型(如 DeepSeek)的恐慌是误解
📊 按方向分类汇总
- AI 工具定价与成本: Uber $1500 月限、亚马逊 tokenmaxxing 事件,企业 AI 工具成本问题成为月度焦点
- AI Agent 治理与教育: 斯坦福 CS336 发布 AI Agent 使用指南,教育界开始制定 AI 使用规范
- AI Coding Agent 体验: 权限疲劳游戏引发共鸣,维护成本论点引发深度讨论
- 开源模型地缘政治: Airbnb CEO 就中国开源模型发表看法
🔥 Hacker News AI 热帖(周榜)
搜索范围: 4 个搜索词(”AI agent” / “AI coding LLM” / “AI open source model” / “AI tool”)× pastWeek,合并去重后 50 条
📅 周榜
🏆 Tier 1 — 超级爆款(200+ points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 1044 | Gemma 4 12B:统一的无编码器多模态模型 | 新闻 | 388 | Google 发布 Gemma 4 12B,首个无需视觉编码器的统一多模态开源模型,架构创新引发热议,points 破千 |
| 611 | Uber 每月 1500 美元的 AI 使用上限,是 AI 工具定价的有用信号 | 文章 | 760 | Simon Willison 分析 Uber 限制 AI 工具支出的深层含义,企业 AI 工具成本问题引发大量讨论 |
| 501 | 斯坦福 CS336 课程 AI Agent 指南 | 文章 | 153 | 斯坦福深度学习课程发布 AI Agent 使用准则,定义了教育场景下 AI 辅助的边界 |
| 253 | Open Code Review — AI 驱动的代码审查 CLI 工具 | Show HN | 67 | 阿里巴巴开源的 AI 代码审查命令行工具,支持多语言,可直接集成 CI/CD 流水线 |
| 199 | 韩国论坛将要求用 AI 审查工具扫描每张图片 | 新闻 | 127 | 韩国通过新规要求在线社区使用 AI 审查工具扫描所有上传图片,隐私与审查争议引爆 HN 讨论 |
| 193 | Gemma 4 QAT 模型:为移动端和笔记本效率优化的量化感知训练 | 文章 | 57 | Google 发布 Gemma 4 量化感知训练版本,针对手机和笔记本做了极致压缩优化,端侧 AI 能力再进阶 |
🥇 Tier 2 — 高热度(100-200 points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 105 | Ask HN: 你的 AI 开发技术栈和工作流是什么? | Ask HN | 87 | 社区热议当前 AI 开发工具链选择,涵盖 Claude Code、Cursor、Copilot 等,是了解 AI 开发者生态的绝佳窗口 |
| 100 | Launch HN: Expanse (YC P26) — 释放闲置 GPU 算力 | Launch HN | 27 | YC P26 项目,搭建平台连接闲置 GPU 资源,为 AI 训练/推理提供低成本算力 |
🥈 Tier 3 — 中等热度(40-100 points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 94 | 微软发布 Scout,基于 OpenClaw 构建的自主 AI Agent | 新闻 | 87 | 微软发布自主 AI Agent “Scout”,基于 OpenClaw 框架,标志着大厂正式下场 AI Agent 领域 |
| 85 | AI Agent 现在需要 RSS 能做的事 | 文章 | 65 | 分析 AI Agent 如何需要类似 RSS 的标准协议来获取结构化信息,RSS 的精神在 AI 时代重生 |
| 77 | Launch HN: Hyper (YC P26) — 驱动 Agentic 开发的公司大脑 | Launch HN | 76 | YC P26 项目,构建”公司大脑”概念,为 Agentic 开发提供统一知识管理和协作平台 |
| 75 | Sergey Brin 告诉谷歌员工每周工作 60 小时是「最佳平衡点」 | 新闻 | 79 | Brin 在 AI 竞赛压力下呼吁员工加班,引发科技圈工作文化大讨论 |
| 47 | Show HN: 形式化验证多边形求交 — Opus 4.8 一次性搞定,之前失败 | Show HN | 14 | 用 Claude Opus 4.8 完成之前模型无法搞定形式化验证代码,展示 AI coding 能力跃迁 |
| 40 | 从零构建 AI Agent:Tools 篇 | 文章 | 0 | 实战教程,手把手教你从零构建带工具调用能力的 AI Agent |
🥉 Tier 4 — 值得关注(<40 points,新品/有趣项目)
- [39 pts] Launch HN: Rudus (YC P26) — 面向混凝土承包商的 AI — YC 项目,AI 赋能建筑行业
- [36 pts] Ask HN: 你如何找到深度技术内容? — 社区讨论深度技术内容的发现渠道
- [33 pts] Show HN: 150 行代码构建自己的 AI Agent CLI — 极简实现教程
- [32 pts] 我不再使用 AI 了 — 反 AI 潮流的个人反思文章
- [32 pts] 星巴克放弃无法数数的 AI 库存工具 — AI 工具在实际场景中失败的案例
- [20 pts] Show HN: Hitoku Draft — 上下文感知的本地助手 — 本地 AI 助手新品
- [19 pts] Ask HN: 高中生学编程还有价值吗? — AI 时代编程教育的反思
- [17 pts] 开源项目暗藏指令要求 AI Agent 删除其代码 — 开源社区对 AI Agent 的抵制新方式
- [14 pts] Majorana 2:微软新量子芯片 — 微软量子计算新突破
- [13 pts] Mellum2 开源:面向 AI 工作流的快速模型 — JetBrains 开源其 AI 代码模型
- [12 pts] Ask HN: 将 Agentic 应用部署到生产环境的最惨经历 — 生产环境踩坑经验分享
- [12 pts] Gemini Spark 是我体验过的最令人印象深刻也最恐怖的 AI — Google Gemini Agent 能力评测
- [11 pts] Show HN: 7 个 AI 系统的黑盒 API Bug 检测 — AI 系统可靠性测试工具
- [11 pts] AI 成本将成为大规模裁员的新借口 — 讨论企业用 AI 成本为裁员辩护
- [10 pts] 我用图数据库替换了 AI Agent 的扁平知识库 — AI Agent 知识管理架构升级
- [10 pts] Show HN: AgentKitten — Swift 语言多 Provider AI Agent 框架 — Swift 生态 AI Agent 开发工具
- [10 pts] 微软发布 Project Solara,面向 AI Agent 的设备平台 — 微软布局 AI Agent 操作系统
- [9 pts] Show HN: 构建了 AI Agent 自主交易的链上经济系统 — AI Agent + 区块链结合实验
- [9 pts] AI 编程 Agent 的 UI 问题 — 分析 AI 编程工具的界面设计痛点
- [9 pts] Y Combinator CEO 称每天用 AI 写 37000 行代码 — Garry Tan 的 AI 编程效率声明
- [9 pts] Show HN: Hydron — 硬件感知编程 Agent — 考虑硬件特性的 AI 编程助手
- [9 pts] 这首歌是 AI 生成的吗?芝加哥大学科学家创建检测工具 — AI 音乐检测工具
- [8 pts] Show HN: Intencion — 持续改进 AI Agent 的产品分析工具 — AI Agent 运营分析平台
- [8 pts] Show HN: MetaBrain — AI Agent 的本地文档记忆 — 为 AI Agent 提供本地知识检索
- [7 pts] Show HN: Agent-browser-shield — 保护 AI Agent 上网安全的免费扩展 — AI Agent 浏览器安全工具
- [7 pts] Show HN: 通过智能手表/CarPlay 语音控制编程 Agent — 创新的 AI Agent 交互方式
- [7 pts] AI 工具发现难题 — 讨论如何发现和评估 AI 工具
- [7 pts] Meta 缩减内部鼠标追踪技术计划,因员工担忧 — 隐私与 AI 监控冲突
- [7 pts] Show HN: 用 Gemma 4 做 Mac 截图命名的本地 AI 应用 — 本地 AI 应用实例
- [7 pts] Show HN: 帮小情侣和解的 AI App — 趣味 AI 应用
- [6 pts] Show HN: 多主机 AI Agent 云管理工具 — AI Agent 基础设施管理
- [6 pts] Google SRE 如何部署 Agentic AI 提升运维效率 — Google 内部 AI Agent 实践
- [6 pts] Architect MCP and TUI — MCP 协议与 TUI 结合
- [6 pts] Ask HN: ChatGPT 推荐工具时你的网站会出现吗? — AI 时代的 SEO 新思考
- [6 pts] Show HN: Agents — 用订阅而非 API 费用运行编程 Agent — 创新的 AI Agent 计费模式
🎯 社区核心信号
- Google Gemma 4 引爆开源模型圈:Gemma 4 12B 以”无编码器多模态”架构拿下 1044 points,加上 QAT 量化版本面向端侧部署,Google 在开源模型领域强力出击
- 企业 AI 工具成本焦虑全面爆发:Uber 月限 $1500、亚马逊 tokenmaxxing 丑闻、星巴克 AI 库存工具翻车——AI 工具在企业场景的 ROI 问题成为本周最大焦点
- AI Agent 生态快速膨胀:微软 Scout、Project Solara、YC P26 密集发布 Agent 项目——大厂和创业公司同时在 AI Agent 赛道发力
- AI Agent 基础设施层成型:RSS 协议复兴、Agent 浏览器安全扩展、多主机管理工具——Agent 基础设施和协议层开始出现
- AI 工具定价模式探索:从按 token 计费到订阅模式,社区在探索更可持续的 AI 工具商业模式
- 反 AI 声音持续存在:”我不再使用 AI”、开源项目暗藏反 AI 指令、高中生学编程价值讨论——社区对 AI 的反思和抵制仍在持续
- AI 审查与隐私成为新战场:韩国 AI 图片审查法规和 Meta 鼠标追踪争议,AI 监管话题升温
🎓 Reddit r/MachineLearning
📅 月榜 Top 15
| # | Flair | 标题 | 分数 | 💬 | 作者 |
|---|---|---|---|---|---|
| 1 | 新闻 | arXiv 对含有明确未经检查的 LLM 生成错误(如幻觉引用或结果)的论文实施 1 年禁令 | 703 | 85 | Nunki08 |
| 2 | 讨论 | 对 arXiv 提议的 1 年禁令的强烈反对令人费解 | 584 | 165 | NeighborhoodFatCat |
| 3 | 研究 | Hugging Face 复活 PapersWithCode | 380 | 39 | NielsRogge |
| 4 | 讨论 | 项目误导高中生付费参与 ML 研究学术不端行为 | 264 | 38 | Marisu_BG |
| 5 | 研究 | AI 生成的 CUDA 内核静默破坏训练和推理 | 265 | 30 | laginimaineb |
| 6 | 讨论 | 低质量内容让我感到与 AI 研究脱节 | 239 | 84 | Skye7821 |
| 7 | 讨论 | ML 博士生,你们平均每天工作多少小时? | 161 | 71 | akardashian |
| 8 | 项目 | PapersWithCode 新功能 - 第一周 | 153 | 9 | NielsRogge |
| 9 | 讨论 | 复杂性理论并未证明 ML 无法达到人类水平表现 | 151 | 53 | mike_uoftdcs |
| 10 | 项目 | 新数据集:超过 1 亿张高质量精选图像,含标题和元数据 | 130 | 29 | dh7net |
| 11 | 讨论 | 被一位咄咄逼人的”独立研究者”骚扰,要求在我的论文中使用特定引用和措辞 | 123 | 67 | snekslayer |
| 12 | 讨论 | OpenAI 声称通用推理模型找到了 Erdős 单位距离界限的反例 | 119 | 39 | NutInBobby |
| 13 | 讨论 | 我在华为温哥华面试 ML 研究岗的经历:宣传与评估方式严重不匹配 | 119 | 18 | Adventurous-Cut-7077 |
| 14 | 研究 | 对持续学习研究感兴趣的人 | 115 | 40 | Evening-Living-9822 |
| 15 | 讨论 | 你们去哪里进行严肃的 AI 研究讨论? | 106 | 60 | Possible-Active-1903 |
💬 热门帖子评论摘要
帖子:arXiv 对含有明确未经检查的 LLM 生成错误(如幻觉引用或结果)的论文实施 1 年禁令
- 支持这个决定 (👍 260)
- 说实话,我现在支持对所有共同作者实施 3-5 年禁令。目前的情况几乎是对科学社区的 DDoS 攻击… (👍 227)
- 我认为未经检查的 LLM 使用等同于伪造数据,因为它很可能生成从未发生过的幻觉结果,这会消除对整篇论文的信任。在传统期刊中,这会让你作为第一作者被终身禁止从事科学研究… (👍 69)
帖子:对 arXiv 提议的 1 年禁令的强烈反对令人费解
- 反对的人显然就是那些提交低质量内容的人… (👍 471)
- 很难相信有人会反对这个。这不应该成为争议话题 (👍 312)
- 不可思议。我的导师会逐行审阅论文。我有时会放入愚蠢的笑话作为标记,每次他都会用红笔划掉。无法想象成为一名教授却连自己署名的东西都不审阅所需的懒惰程度… (👍 114)
- 我最大的担忧是 arXiv 是否验证每位作者确实签署了论文… (👍 45)
帖子:Hugging Face 复活 PapersWithCode
- 当我还是研究生时,这个网站是我了解模型/数据集/方法论最新趋势的首选。很高兴它回来了。谢谢 (👍 99)
- 感谢你们做上帝的工作,我也是这个网站的粉丝。我是学术界的,如果需要帮忙请告诉我 (👍 43)
- PapersWithCode 最重要的功能是「实现」列表,可以看到实现特定论文的所有 GitHub 仓库 (👍 27)
- 这类网站的主要问题是任务和基准测试有大量重复,有些任务过于特定以至于只有一篇论文讨论 (👍 9)
- 功能请求:标记分类错误的论文。AI agent 做得不错,但会犯错,比如将 Test-Time Scaling 论文分类为 Text-To-Speech (👍 6)
帖子:项目误导高中生付费参与 ML 研究学术不端行为
- 我几年前在南湾一所理工科强校就读。当时很多同学为了提升大学申请会申请竞争激烈的暑期研究项目(当然要花钱),在实验室工作获得研究经验… (👍 89)
- 看起来有人甚至写了关于这个的文章。这确实说明了现在 ML 研究的「严谨性」,考虑到他们的 113 篇论文中有 89 篇被 NeurIPS 接收… (👍 51)
- 这确实看起来非常可疑。我只是想知道你是如何检查这些错误的 (👍 18)
- 最荒谬的是这个人没有博士甚至硕士学位。而且他在开始这个之前几乎没有足够的研究经验来胜任… (👍 14)
帖子:AI 生成的 CUDA 内核静默破坏训练和推理
- 原来实际的 bug 是嵌入梯度部分的内核在 bf16 而非 fp32 中累加。很多人永远找不到这种问题。有些人可能会看到但忽略它,因为 bf16 使用太频繁了 (👍 93)
- 所以解决方案是用 AdamW… (👍 36)
- 没有什么比花 3 天调试模型最后发现内核从一开始就有问题更能磨练性格的了 (👍 20)
🎯 核心洞察
Flair 分类统计:
- 讨论: 9 篇
- 研究: 3 篇
- 项目: 2 篇
- 新闻: 1 篇
社区趋势观察:
- 本月最大热点:arXiv 对 LLM 生成内容的论文实施禁令引发激烈讨论,社区对学术诚信高度关注
- Hugging Face 复活 PapersWithCode 项目,受到社区广泛欢迎
- AI 生成代码(CUDA 内核)的可靠性引发担忧,暴露自动化代码生成的隐患
- ML 博士生工作压力和学术生态讨论持续热门
- Discussion 类帖子占主导(9/15),显示社区高度关注学术规范和职业发展话题
🎓 Reddit r/MachineLearning(周榜)
📅 周榜 Top 15
| # | Flair | 标题 | 分数 | 💬 | 作者 |
|---|---|---|---|---|---|
| 1 | 讨论 | NeurIPS 使用未校准的 AI 检测器进行桌面拒稿 | 101 | 62 | Asleep-Requirement13 |
| 2 | 研究 | 世界模型目前的研究重点是什么? | 76 | 23 | nat-abhishek |
| 3 | 研究 | On-policy 蒸馏:PapersWithCode 上最热门的术语之一 | 70 | 14 | NielsRogge |
| 4 | 项目 | 在 PapersWithCode 上浏览 CVPR 2026 论文 | 68 | 18 | NielsRogge |
| 5 | 新闻 | MiniMax 发布了新的注意力架构 | 58 | 10 | superintelligence03 |
| 6 | 讨论 | 没有 PhD 实习就毕业 | 54 | 38 | NumberGenerator |
| 7 | 讨论 | 为什么 Word2Vec 的输出层权重会变成词向量? | 27 | 12 | aaryantiwari26 |
| 8 | 讨论 | 你如何识别优秀的研究者? | 27 | 22 | roguejedi1 |
| 9 | 研究 | UAI 结果已公布 | 25 | 89 | GeeseChen |
| 10 | 研究 | KVarN:方差归一化 KV-Cache 量化 | 21 | 8 | intentionallyBlue |
| 11 | 讨论 | 首篇论文被接收(ICML Workshop),我应该参加吗? | 16 | 10 | YukiOnnaLake |
| 12 | 讨论 | AlphaZero 训练数据分析 | 14 | 1 | YamEnvironmental4720 |
| 13 | 讨论 | 为什么我们 LightGBM 最重要的特征反而让预测变差 | 7 | 11 | Nj-yeti |
| 14 | 讨论 | 用监督学习还是强化学习微调推理 LLM? | 9 | 6 | zdeneklapes |
| 15 | 讨论 | ICML openreviews 什么时候公开? | 8 | 13 | camelCasedUser |
🎯 核心洞察(周榜)
Flair 分类统计:
- 讨论: 9 篇
- 研究: 4 篇
- 项目: 1 篇
- 新闻: 1 篇
本周社区趋势:
- 本周最大争议:NeurIPS 使用未校准的 AI 检测器进行桌面拒稿,引发学术公正性质疑
- MiniMax 发布新注意力架构,引起技术社区关注
- CVPR 2026 论文已在 PapersWithCode 上线,社区可浏览最新研究
- 世界模型(World Models)研究方向引发讨论,持续是热门话题
- KV-Cache 量化等推理优化技术持续受关注
- Discussion 占 9/15,社区关注职业发展、研究方法论和会议动态
🚀 Product Hunt
📅 月榜 Top 17(2026 年 6 月)
| # | 产品 | 👍 | 💬 | 标签 | 说明 |
|---|---|---|---|---|---|
| 1 | Fundraisly | 267 | 1,086 | 风险投资 · 人工智能 · 融资 | AI 融资代理,自动寻找投资人并预约会议 |
| 2 | Elentaria | 96 | 529 | 销售 · 营销 | 从诊断到执行的一站式 GTM(市场进入)解决方案 |
| 3 | Mailwarm 2.0 | 103 | 566 | 邮件 · 邮件营销 | 邮件预热工具升级版,提升邮件送达率 |
| 4 | InsForge Backend Branching | 184 | 530 | 开源 · 开发者工具 · GitHub | 后端的 Git 风格分支管理系统 |
| 5 | Mina Meeting Assistant | 134 | 467 | 效率 · 人工智能 · 无代码 | AI 会议助手,通话中实时响应和执行任务 |
| 6 | Vokal | 50 | 451 | 效率 · 消息 · 人工智能 | 面向 10x 团队和 AI 代理的协作空间 |
| 7 | superlog | 79 | 442 | 开源 · 软件工程 · 开发者工具 | 让你的产品告别 Bug |
| 8 | SocialEcho 2.0 | 132 | 388 | 社交媒体 · 营销 · SaaS | AI 社交媒体副驾驶,面向团队和智能代理 |
| 9 | Astra Autonomous Pentest | 55 | 398 | SaaS · 开发者工具 · 安全 | AI 代理自动发现、验证和修复安全漏洞 |
| 10 | Databox MCP | 59 | 360 | 效率 · 数据分析 · 人工智能 | 在 Claude、ChatGPT 等工具中与业务数据对话 |
| 11 | Dune Keypad | 55 | 357 | 效率 · 开发者工具 · 人工智能 | 上下文感知 Mac 键盘,支持 Claude 和社区扩展 |
| 12 | Gigacatalyst | 39 | 293 | 销售 · SaaS · 人工智能 | 赋予销售和客户成功团队工程超能力 |
| 13 | Empromptu AI | 113 | 321 | 开发者工具 · 人工智能 · 无代码 | 用已有 AI 应用训练微调模型 |
| 14 | folk | 70 | 303 | 效率 · 消息 · 人工智能 | 短信中的 AI 助手,帮你搞定事务 |
| 15 | Typeahead | 47 | 296 | 效率 · 写作 · 人工智能 | Mac 上所有应用的 AI 自动补全 |
| 16 | Co-Invest | 37 | 276 | 金融科技 · 投资 · 金融 | 直接在 ChatGPT 和 Claude 中交易 500+ 市场 |
| 17 | Google Gemma 4 12B | 7 | 286 | 开源 · 开发者工具 · GitHub | 无编码器架构的本地多模态 AI 模型 |
📅 周榜 Top 17(2026-W23,6 月 1—7 日)
| # | 产品 | 👍 | 💬 | 标签 | 说明 |
|---|---|---|---|---|---|
| 1 | Fundraisly | 267 | 1,086 | 风险投资 · 人工智能 · 融资 | AI 融资代理,自动寻找投资人并预约会议 |
| 2 | Mailwarm 2.0 | 103 | 566 | 邮件 · 邮件营销 | 邮件预热工具升级版,提升邮件送达率 |
| 3 | InsForge Backend Branching | 184 | 530 | 开源 · 开发者工具 · GitHub | 后端的 Git 风格分支管理系统 |
| 4 | Elentaria | 96 | 529 | 销售 · 营销 | 从诊断到执行的一站式 GTM(市场进入)解决方案 |
| 5 | Mina Meeting Assistant | 134 | 467 | 效率 · 人工智能 · 无代码 | AI 会议助手,通话中实时响应和执行任务 |
| 6 | Vokal | 50 | 451 | 效率 · 消息 · 人工智能 | 面向 10x 团队和 AI 代理的协作空间 |
| 7 | superlog | 79 | 442 | 开源 · 软件工程 · 开发者工具 | 让你的产品告别 Bug |
| 8 | SellerClaw | 133 | 400 | SaaS · 电商 | AI 代理团队帮你跨渠道管理店铺 |
| 9 | Astra Autonomous Pentest | 55 | 398 | SaaS · 开发者工具 · 安全 | AI 代理自动发现、验证和修复安全漏洞 |
| 10 | SocialEcho 2.0 | 132 | 388 | 社交媒体 · 营销 · SaaS | AI 社交媒体副驾驶,面向团队和智能代理 |
| 11 | Databox MCP | 59 | 360 | 效率 · 数据分析 · 人工智能 | 在 Claude、ChatGPT 等工具中与业务数据对话 |
| 12 | Dune Keypad | 55 | 357 | 效率 · 开发者工具 · 人工智能 | 上下文感知 Mac 键盘,支持 Claude 和社区扩展 |
| 13 | Minimi | 57 | 347 | 效率 · 人工智能 · 科技 | 你的 Claude 环境记忆工具 |
| 14 | Leni | 54 | 336 | 投资 · 人工智能 · 数据分析 | 全球最精准的投资人 AI |
| 15 | Empromptu AI | 113 | 321 | 开发者工具 · 人工智能 · 无代码 | 用已有 AI 应用训练微调模型 |
| 16 | folk | 70 | 303 | 效率 · 消息 · 人工智能 | 短信中的 AI 助手,帮你搞定事务 |
| 17 | Typeahead | 47 | 296 | 效率 · 写作 · 人工智能 | Mac 上所有应用的 AI 自动补全 |
🎯 独家发现
闭源 SaaS 新品(其他源难以获取)
- Fundraisly:AI 融资代理 SaaS,267 票/1086 评论高居榜首,体现 AI + 金融的强劲需求
- Elentaria:GTM(市场进入)诊断与执行平台,销售营销领域的 AI 工具
- Mailwarm 2.0:邮件预热 SaaS 升级版,专注邮件送达率优化
- SellerClaw:AI 代理驱动的多渠道电商管理平台(周榜独有)
- Gigacatalyst:面向销售和客户团队的 AI 工程赋能工具
AI 产品热度排名
- 🥇 Fundraisly(AI 融资)— 1,086 💬,月/周双榜冠军
- 🥈 InsForge Backend Branching(开源开发工具)— 530 💬
- 🥉 Mailwarm 2.0(邮件 AI)— 566 💬
- Mina Meeting Assistant(AI 会议)— 467 💬
- Vokal(AI 协作)— 451 💬
- superlog(AI 调试)— 442 💬
周榜 vs 月榜差异产品
- 周榜独有:SellerClaw(电商 AI)、Minimi(Claude 记忆工具)、Leni(投资 AI)
- 月榜独有:Gigacatalyst(销售赋能)、Co-Invest(金融交易)、Google Gemma 4 12B(开源模型)
趋势洞察
- AI Agent 产品持续霸榜,Top 17 中约 13 款产品涉及 AI
- MCP 协议生态产品涌现(Databox MCP、Dune Keypad 支持 Claude)
- 开发者工具赛道热度不减(InsForge、superlog、Empromptu AI)
- 金融/投资领域 AI 化趋势明显(Fundraisly、Co-Invest、Leni)
📰 Techmeme AI 行业新闻
过去 7 天 AI 相关行业新闻精选(来源:TechCrunch / The Verge / Bloomberg / Reuters / NYT / WSJ 等)
📅 本周 AI 新闻 Top 15
| # | 标题 | 来源 | 说明 |
|---|---|---|---|
| 1 | Anthropic 向 SEC 机密提交 S-1 招股书草案 | Anthropic | Anthropic 正式提交 IPO 招股书草案,计划最早今年秋季上市,与 OpenAI、SpaceX 一起成为 2026 年最受关注的上市项目 |
| 2 | Anthropic 确认已机密提交 IPO 申请 | 纽约时报 | 多家媒体同时报道,Anthropic 加入 OpenAI 和 SpaceX 的 2026 上市潮,三家合计可能为美股增加约 $4T 市值 |
| 3 | ChatGPT 成为最快达到 10 亿全球月活用户的应用 | 路透社 | Sensor Tower 数据显示 ChatGPT MAU 同比增长 62%,Claude MAU 同比增长 640% 至 5600 万,AI 应用用户增长惊人 |
| 4 | Meta 推出 Meta Business Agent 商业 AI 代理 | TechCrunch | Meta 在 WhatsApp、Instagram 和 Messenger 上推出商业 AI 代理,可自动回答客户问题、完成销售和预约,全面布局商业 AI |
| 5 | 微软与 OpenAI 分道扬镳,准备正面对决 | The Verge | 微软 AI CEO Mustafa Suleyman 表示微软目标是成为”全球前四 AI 实验室”,与 OpenAI 重新谈判合同是关键转折点 |
| 6 | Anthropic 公布递归自我改进进展 | Anthropic | Anthropic 披露其代码库中 80%+ 的代码由 Claude 编写,AI 自我改进能力取得重大突破 |
| 7 | Anthropic 推出 Claude 合作伙伴网络服务层级 | 华尔街日报 | Anthropic 推出 Claude Partner Network 服务等级体系,根据企业使用 Claude 构建的产品进行排名,并发布 Partner Hub 门户 |
| 8 | 中国 AI 开发商 MiniMax 发布 M3 编程模型 | The Information | MiniMax 发布 M3 编程模型,号称媲美 Claude Opus 4.7,输入 token 价格仅 $0.12/百万(对比 Opus 4.7 的 $5),中国 AI 模型竞争白热化 |
| 9 | Google 发布 Gemma 4 12B 开源模型 | Google DeepMind | Gemma 4 12B 发布,统一架构移除独立多模态编码器,支持本地视觉和音频理解及高级推理,可在 8-16GB VRAM 设备运行 |
| 10 | Salesforce 持有 Anthropic 约 50 亿美元股份 | 彭博社 | Salesforce 自 2023 年初起持续投资 Anthropic,持股价值已增至约 $5B,大厂通过投资深度绑定 AI 初创 |
| 11 | 机器人初创 Generalist 融资 4 亿美元 | Bloomberg | 机器人公司 Generalist 发布 GEN-1 模型可完成短距物理任务,获 Radical Ventures 领投 $400M,估值 $2B |
| 12 | 白宫与 Anthropic 争端缓和 | 路透社 | 消息人士称白宫与 Anthropic 长达数月的分歧正出现缓解迹象,为 IPO 扫清政治障碍 |
| 13 | 剑桥大学开发首个 AI 设计关键成分的疫苗 | BBC | 剑桥大学研究人员开发了首个关键成分完全由 AI 设计的疫苗,并已在人体中进行试验,AI 在药物研发领域的里程碑 |
| 14 | Google 要求 Play 开发者出售代码库访问权用于 AI 训练 | 404 Media | 邮件曝光 Google 邀请 Google Play 开发者参加”机密内容试点”,付费获取代码库访问权以训练 AI 编程工具 |
| 15 | SpaceX 获 550 亿美元芯片工厂财产税豁免 | 金融时报 | SpaceX 在德州计划中的 $55B Terafab 芯片工厂获得财产税豁免,尽管面临当地居民反对和法律威胁 |
🎯 行业核心动态
大公司动向(产品发布、收购、融资)
- Anthropic IPO 加速:机密提交 S-1,估值有望成为 2026 年最大科技 IPO 之一;同期推出合作伙伴生态体系,代码库 80%+ 由 Claude 自行编写
- Microsoft 正式”单飞”:与 OpenAI 重新谈判合同后,微软 AI CEO 明确表态要成为全球前四 AI 实验室,不再依赖 GPT
- Meta 全面商业化 AI:推出 Meta Business Agent,覆盖 WhatsApp/Instagram/Messenger 三大平台,从社交走向商业智能
- Google 开源 Gemma 4:12B 参数模型支持本地多模态推理,降低 AI 部署门槛,与开源社区深度绑定
政策法规(AI 监管、版权诉讼)
- 白宫与 Anthropic 的监管分歧出现缓和迹象,为 Anthropic IPO 扫清政治障碍
- Google 被曝付费获取 Play 开发者代码库用于 AI 训练,数据合规边界再次引发关注
- 伊利诺伊州州长计划暂停数据中心税收优惠,要求建立开发框架
商业化进展
- ChatGPT 成为史上最快达到 10 亿月活的应用,Claude MAU 增速更达 640%
- 中国 AI 模型价格战激烈:MiniMax M3 以 Opus 4.7 约 1/40 的价格提供可比性能
- Salesforce 持有 Anthropic 股份价值飙升至 $5B,大厂通过投资锁定 AI 生态位
- SpaceX/Anthropic/OpenAI 三家 IPO 合计可能为美股增加约 $4T 市值
📈 Trendshift — GitHub 项目社交热度
数据来源:trendshift.io | 采集时间:2026-06-06 05:46 UTC+8
📅 日榜 Top 10(今日爆发)
| # | 项目 | 📈 今日增长 | 提及 | 说明 | 主题 |
|---|---|---|---|---|---|
| 1 | pewdiepie-archdaemon/odysseus | 1.2k | 176 | 自托管 AI 工作空间 | AI Agent, 自托管 |
| 2 | chopratejas/headroom | 553 | 27 | LLM 应用上下文优化层 | AI Agent, AI 基础设施 |
| 3 | anthropics/defending-code-reference-harness | 494 | 38 | AI 安全扫描工具(威胁建模+自主扫描 Harness) | AI Agent |
| 4 | alibaba/open-code-review | 449 | 13 | 阿里巴巴混合架构 AI 代码审查(规则引擎+LLM Agent) | AI Agent, AI 编码助手 |
| 5 | nexu-io/html-video | 412 | 46 | 面向编码 Agent 的 HTML→视频元层 | AI Agent, AI 视频生成, 无头浏览器 |
| 6 | colbymchenry/codegraph | 452 | 26 | Claude Code 预索引代码知识图谱(本地运行) | AI 编码助手 |
| 7 | BigPizzaV3/CodexPlusPlus | 322 | 23 | CodexApp 增强工具,让 Codex 更好用 | AI 编码助手 |
| 8 | farion1231/cc-switch | 300 | 26 | 跨平台 AI 编码助手桌面客户端(支持 Claude Code/Codex/OpenCode/OpenClaw 等) | AI 编码助手, MCP |
| 9 | obra/superpowers | 256 | 29 | Agent 技能框架与软件开发方法论 | AI Agent, AI 编码助手, AI 技能 |
| 10 | PaddlePaddle/PaddleOCR | 244 | 14 | 百度 OCR 工具集,支持 100+ 语言,打通 PDF/图像与 LLM | 计算机视觉, NLP, 文档处理 |
📊 日榜主题热度分布
| 排名 | 主题 | 总星标 |
|---|---|---|
| 1 | AI Agent | 13.4k |
| 2 | AI 编码助手 | 5.4k |
| 3 | AI 技能 | 4.3k |
| 4 | 自托管 | 3.6k |
| 5 | AI 工作流 | 1.9k |
| 6 | AI 基础设施 | 1.6k |
| 7 | AI 视频生成 | 1.2k |
| 8 | MCP | 1.1k |
| 9 | NLP | 1.1k |
| 10 | RAG | 1k |
🔥 值得关注
- anthropics/defending-code-reference-harness — Anthropic 官方出品,AI Agent 安全领域新工具
- alibaba/open-code-review — 阿里巴巴开源混合架构代码审查,内置细粒度规则集(NPE、线程安全、XSS、SQL 注入)
- PaddlePaddle/PaddleOCR — 老牌项目持续活跃,OCR 作为 AI 数据管道关键组件热度不减
📈 Trendshift — GitHub 项目社交热度(周榜)
数据来源:trendshift.io/weekly | 采集时间:2026-06-06 05:46 UTC+8
📅 周榜 Top 10(持续热度)
| # | 项目 | 📈 周增长 | 提及 | 说明 | 主题 |
|---|---|---|---|---|---|
| 1 | pewdiepie-archdaemon/odysseus | 39k | 4.3k | 自托管 AI 工作空间 | AI Agent, 自托管 |
| 2 | chopratejas/headroom | 8.1k | 464 | LLM 应用上下文优化层 | AI Agent, AI 基础设施 |
| 3 | microsoft/markitdown | 8.7k | 597 | 文件/Office 文档转 Markdown(AI 数据准备) | 文档处理 |
| 4 | nesquena/hermes-webui | 3.4k | 252 | Hermes Agent Web/手机界面 | AI Agent, 自托管 |
| 5 | affaan-m/ECC | 6.1k | 957 | Agent 性能优化系统(技能+本能+记忆+安全) | AI Agent, AI 编码助手, AI 技能 |
| 6 | NousResearch/hermes-agent | 5.5k | 1.3k | 可成长的 AI Agent(由 NousResearch 出品) | AI Agent, AI 技能 |
| 7 | supermemoryai/supermemory | 2.1k | 124 | AI 时代的高速可扩展记忆引擎 | AI Agent, AI 记忆, RAG |
| 8 | farion1231/cc-switch | 4.8k | 340 | 跨平台 AI 编码助手桌面客户端(支持 Claude Code/Codex/OpenCode/OpenClaw 等) | AI 编码助手, MCP |
| 9 | harry0703/MoneyPrinterTurbo | 5.2k | 693 | AI 大模型一键生成高清短视频 | AI 视频生成 |
| 10 | colbymchenry/codegraph | 5k | 319 | Claude Code 预索引代码知识图谱(本地运行) | AI 编码助手 |
🎯 核心洞察
🔍 与 GitHub Trending 的差异项目(Trendshift 独家发现)
以下项目在社交媒体上爆发式传播,但可能不会出现在 GitHub Trending 上:
- pewdiepie-archdaemon/odysseus — 日榜/周榜双冠王,周增 39k,社交媒体传播极强。自托管 AI 工作空间,社区讨论远超 star 增速
- farion1231/cc-switch — AI 编码助手桌面客户端(支持 Claude Code/Codex/OpenCode/OpenClaw 等),社交热度远超 GitHub star
- affaan-m/ECC — Agent 性能优化系统,957 周提及量排名第二,Twitter/X 讨论火爆
- MadsLorentzen/ai-job-search — AI 驱动求职框架(日榜 #22),40 提及 / 145 增长 = 27.6% 提及率,社交媒体传播效率极高
- asz798838958/aBaiAutoplus — 多平台 AI 账号自动注册与管理,中文社区热点项目(周榜 #18,606 提及)
📣 社交媒体传播最快的项目
按「提及数 / 增长数」比率排序(比率越高 = 社交传播越强):
| 项目 | 增长 | 提及 | 提及率 | 说明 |
|---|---|---|---|---|
| NousResearch/hermes-agent | 5.5k | 1.3k | 23.6% | 可成长 Agent,社区讨论热烈 |
| affaan-m/ECC | 6.1k | 957 | 15.7% | Agent 性能优化系统 |
| harry0703/MoneyPrinterTurbo | 5.2k | 693 | 13.3% | AI 短视频生成 |
| nexu-io/html-video | 412 | 46 | 11.2% | HTML→视频 Agent 工具(日榜) |
| pewdiepie-archdaemon/odysseus | 39k | 4.3k | 11.0% | 自托管 AI 工作空间 |
📌 趋势总结
- AI Agent 框架持续爆发:odysseus、hermes-agent、ECC 等多个 Agent 框架同时上榜,Agent 生态进入百花齐放阶段
- AI 编码助手工具链成熟:cc-switch(桌面客户端)、codegraph(知识图谱)、CodexPlusPlus(增强工具)形成完整工具链
- 自托管需求强劲:odysseus、hermes-webui、open-notebook 等自托管项目上榜,用户对数据隐私和自主可控需求上升
- AI 记忆/上下文优化成为新热点:headroom(上下文优化)、supermemory(记忆引擎)等关注 Agent 长期记忆能力
- 中国 AI 开源项目活跃:PaddleOCR(百度)、open-code-review(阿里)、MoneyPrinterTurbo、aBaiAutoplus 等多个中文项目上榜