AI 趋势周报:2026-W23

🤖 AI 趋势周报 · 2026-W23 (2026-05-30 - 2026-06-05)

📅 本月榜 Top 20

# 项目 语言 ⭐ 总计 📈 本月新增 说明
1 mattpocock/skills Shell 118,616 59,731 为真正的工程师打造的技能集合,直接来自作者的 .claude 目录
2 Lum1104/Understand-Anything TypeScript 52,827 40,734 将任何代码转为可交互知识图谱,支持搜索和提问,兼容 Claude Code、Codex、Cursor 等
3 colbymchenry/codegraph TypeScript 42,221 39,989 预索引代码知识图谱,支持 Claude Code、Codex、Gemini、Cursor 等多种 AI 编程工具,完全本地运行
4 Hmbown/CodeWhale Rust 37,197 34,069 基于 DeepSeek + MiMo 的终端 AI 编程代理
5 harry0703/MoneyPrinterTurbo Python 79,921 23,096 利用 AI 大模型一键生成高清短视频
6 Imbad0202/academic-research-skills Python 27,668 22,914 Claude Code 学术研究技能:研究→写作→审阅→修改→定稿全流程
7 CloakHQ/CloakBrowser Python 24,164 22,392 隐身 Chromium 浏览器,通过所有机器人检测测试,Playwright 替代方案
8 anthropics/financial-services Python 30,120 22,190 Anthropic 官方金融服务行业 AI 解决方案
9 rohitg00/ai-engineering-from-scratch Python 28,798 22,038 AI 工程从零学起:学会、构建、交付
10 rohitg00/agentmemory TypeScript 21,387 19,078 AI 编程代理的持久化记忆方案,基于真实世界基准测试排名第一
11 ruvnet/RuView Rust 71,025 19,728 利用普通 WiFi 信号实现实时空间感知、生命体征监测和存在检测,无需摄像头
12 yikart/AiToEarn TypeScript 18,165 8,957 用 AI 来赚钱的工具集
13 datawhalechina/easy-vibe JavaScript 16,208 8,545 Vibe Coding 2026:面向初学者的现代编程入门课程
14 decolua/9router JavaScript 16,466 12,689 无限免费 AI 编程:连接 Claude Code、Codex、Cursor 等到免费 Claude/GPT/Gemini,支持 40+ 供应商自动切换
15 chopratejas/headroom Python 14,411 10,008 在发送给 LLM 之前压缩工具输出、日志和文件,减少 60-95% Token
16 fathah/hermes-desktop TypeScript 10,546 9,244 Hermes Agent 的桌面伴侣应用
17 bytedance/UI-TARS-desktop TypeScript 36,111 6,602 字节跳动开源多模态 AI Agent 框架,连接前沿 AI 模型和 Agent 基础设施
18 can1357/oh-my-pi TypeScript 10,717 6,648 终端 AI 编程代理,支持哈希锚定编辑、LSP、Python、浏览器、子代理等
19 HKUDS/ViMax Python 8,842 6,009 一体化智能视频生成系统:导演、编剧、制片和视频生成器合一

📅 本周榜 Top 20

# 项目 语言 ⭐ 总计 📈 本周新增 说明
1 microsoft/markitdown Python 145,285 17,165 微软出品的文件和 Office 文档转 Markdown 工具
2 harry0703/MoneyPrinterTurbo Python 79,921 14,566 利用 AI 大模型一键生成高清短视频
3 affaan-m/ECC JavaScript 208,272 10,369 Agent 性能优化系统,涵盖技能、直觉、记忆、安全和研究优先开发
4 chopratejas/headroom Python 14,411 9,421 LLM Token 压缩器,减少 60-95% Token 消耗
5 colbymchenry/codegraph TypeScript 42,222 9,452 预索引代码知识图谱,支持多种 AI 编程工具,完全本地运行
6 Lum1104/Understand-Anything TypeScript 52,827 9,895 将任何代码转为可交互知识图谱,兼容主流 AI 编程工具
7 Leonxlnx/taste-skill Shell 33,849 7,531 让 AI 拥有好品味,阻止生成无聊、平庸的 AI 味内容
8 OpenBMB/VoxCPM Python 26,403 5,771 无 Tokenizer 的多语言语音生成 TTS,支持创意声音设计和逼真声音克隆
9 anthropics/claude-code Python 130,414 3,005 Anthropic 官方 Claude Code 终端智能编程工具
10 run-llama/liteparse Rust 9,202 2,877 快速、开源的文档解析器
11 supermemoryai/supermemory TypeScript 25,680 2,740 AI 时代的极速可扩展记忆引擎和 API
12 mukul975/Anthropic-Cybersecurity-Skills Python 14,385 2,698 754 个结构化 AI 网络安全技能,覆盖 MITRE ATT&CK 等 5 大框架
13 hardikpandya/stop-slop 8,831 2,560 移除 AI 生成文本痕迹的技能文件
14 can1357/oh-my-pi TypeScript 10,717 2,348 终端 AI 编程代理,支持哈希锚定编辑、LSP、浏览器等
15 revfactory/harness HTML 6,117 2,159 设计领域专属 Agent 团队、定义专业代理并生成技能的元技能
16 EveryInc/compound-engineering-plugin TypeScript 19,919 2,111 Claude Code、Codex、Cursor 等平台的官方 Compound Engineering 插件
17 ogulcancelik/herdr Rust 4,574 1,544 生活在终端中的 Agent 多路复用器
18 Open-LLM-VTuber/Open-LLM-VTuber Python 9,986 1,604 免手操作语音交互 LLM,支持语音打断和 Live2D 面部追踪
19 cursor/plugins TypeScript 1,856 784 Cursor 插件规范和官方插件

🎯 核心洞察

  • 周榜 vs 月榜对比microsoft/markitdown 周榜飙升至第 1(周增 17,165 ⭐),但未进入月榜 Top 19,说明是本周新爆发项目。affaan-m/ECC 总星 20 万+但周增 10,369 排第 3,是持续热门中的新爆发。OpenBMB/VoxCPM(TTS)和 run-llama/liteparse(文档解析)也是周榜独有,属短期热门。
  • 月榜独有项目mattpocock/skills(月增 59,731)、Hmbown/CodeWhale(月增 34,069)、ruvnet/RuView(WiFi 感知)等月榜高分项目在周榜中热度有所回落,属于持续热门。
  • 语言分布趋势
    • Python 依然是最热门语言,月榜占 8/19,周榜占 7/19
    • TypeScript 紧随其后,月榜占 7/19,周榜占 6/19
    • Rust 项目崛起:月榜 2 个(CodeWhale、RuView),周榜 2 个(liteparse、herdr),系统工具方向明显
    • Shell 作为 AI 技能文件载体出现(mattpoclock/skills、taste-skill、stop-slop)
  • AI 项目占比极高:月榜 19 个项目中约 18 个 与 AI 直接相关(编程代理、AI 工具、AI 生成等),周榜约 17 个 与 AI 相关。GitHub Trending 已实质成为 “AI Trending”。
  • 新兴趋势
    • AI 编程代理生态:Claude Code 技能/插件生态爆发(skills、headroom、9router、ECC 等)
    • Token 压缩/优化:headroom(60-95% 压缩)、9router(RTK -40%)成为刚需
    • 多模态 AI:视频生成(ViMax、MoneyPrinterTurbo)、语音(VoxCPM、Open-LLM-VTuber)
    • 反 AI 味:taste-skill、stop-slop 专注于让 AI 输出更自然

📊 OSSInsight 趋势榜

📅 月榜(2026-06-06)

数据来源:OSSInsight Trending | 100 个项目 | 总计 97,613 Stars

按 AI 方向分类:

🤖 AI Coding Agent / AI 编程助手

# 项目 ⭐ Stars Fork 语言 说明
1 forrestchang/andrej-karpathy-skills 4,449 479 - 基于 Andrej Karpathy 对 LLM 编程陷阱的观察,改进 Claude Code 行为的单一 CLAUDE.md 文件
2 mattpocock/skills 4,147 386 Shell 面向真正工程师的 AI 技能集合,来自作者的 .claude 目录
3 NousResearch/hermes-agent 3,576 826 Python 与你共同成长的 AI Agent
4 obra/superpowers 2,827 275 Shell 代理式技能框架与软件开发方法论
5 colbymchenry/codegraph 2,816 138 TypeScript 预索引代码知识图谱,支持 Claude Code、Codex、Gemini、Cursor 等,减少 Token 消耗
6 Lum1104/Understand-Anything 2,796 218 TypeScript 将任何代码转化为可交互的知识图谱,支持多款 AI 编程工具
7 affaan-m/ECC 2,520 406 JavaScript Agent 性能优化系统,包含技能、本能、记忆和安全机制
8 Hmbown/CodeWhale 2,736 227 Rust 面向开源模型和开放权重的编程 Agent
9 farion1231/cc-switch 2,293 173 Rust 跨平台桌面 All-in-One 助手,支持 Claude Code、Codex、OpenCode 等
10 tinyhumansai/openhuman 2,264 209 Rust 个人 AI 超级智能,私有、简单且强大
11 pewdiepie-archdaemon/odysseus 1,528 145 JavaScript 自托管 AI 工作区
12 garrytan/gstack 1,350 207 TypeScript Garry Tan 的 Claude Code 配置,23 个定制化工具
13 garrytan/gbrain - - TypeScript Garry Tan 的 AI 大脑工具
14 earendil-works/pi 1,102 145 TypeScript AI Agent 工具包:编程 Agent CLI、统一 LLM API、TUI 和 Web UI 库
15 can1357/oh-my-pi - - TypeScript 终端 AI 编程 Agent,支持哈希锚定编辑、LSP、Python、浏览器等
16 ruvnet/ruflo 1,274 160 TypeScript 领先的 Claude Agent 编排平台,支持多 Agent 群体协调
17 rtk-ai/rtk - - Rust CLI 代理,可将常用开发命令的 LLM Token 消耗降低 60-90%
18 decolua/9router 1,130 134 JavaScript 免费 AI 编程无限使用,连接 Claude Code/Codex/Cursor 等到免费 API
19 fathah/hermes-desktop - - TypeScript Hermes Agent 的桌面伴侣
20 nesquena/hermes-webui - - Python Hermes Agent 的 Web 和手机端 UI
21 revfactory/harness - - HTML 设计领域特定 Agent 团队并生成对应技能的元技能
22 Leonxlnx/taste-skill - - - 高级前端技能,让 AI 拥有好品味,避免生成无聊的设计
23 pbakaus/impeccable - - JavaScript 让 AI 工具在设计中表现更好的设计语言
24 chopratejas/headroom - - Python 压缩工具输出/日志/RAG 内容,减少 60-95% Token,保持相同答案质量
25 VoltAgent/awesome-design-md 1,400 142 - 收集流行品牌设计系统的 DESIGN.md 文件,让 AI 编程 Agent 生成匹配的 UI
26 msitarzewski/agency-agents 1,183 186 Shell 完整的 AI 代理机构,从前端到社区的各类专业化 Agent
27 rohitg00/agentmemory 1,481 123 TypeScript 基于实际基准测试的 AI 编程 Agent 持久记忆系统
28 addyosmani/agent-skills 1,726 145 Shell 生产级 AI 编程 Agent 工程技能
29 anthropics/claude-plugins-official 956 70 Python Anthropic 官方管理的高质量 Claude Code 插件目录
30 anthropics/financial-services 2,022 312 Python Anthropic 官方金融服务技能
31 anthropics/knowledge-work-plugins - - Python Anthropic 官方知识工作插件
32 anthropics/claude-for-legal - - Python Anthropic 官方法律领域 Claude 技能
33 github/spec-kit 1,389 124 Python GitHub 官方规格驱动开发工具包
34 rohitg00/ai-engineering-from-scratch 1,627 226 Python 从零开始学 AI 工程:学习、构建、发布
35 Imbad0202/academic-research-skills 1,549 119 Python Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿
36 safishamsi/graphify 1,106 99 Python 将代码/SQL/R脚本/文档/视频转为可查询知识图谱的 AI 编程技能
37 Alishahryar1/free-claude-code - - Python 免费 Claude Code 使用方案
38 shareAI-lab/learn-claude-code - - Python Claude Code 学习教程
39 greensock/gsap-skills - - - GSAP 官方 AI 技能,教授 AI 编程 Agent 正确使用 GSAP
40 tashfeenahmed/freellmapi - - TypeScript 免费 LLM API 访问
41 ConardLi/garden-skills - - CSS 前端花园技能集
42 KKKKhazix/khazix-skills - - Python 数字生命卡兹克开源的 AI Skills 合集
43 coreyhaines31/marketingskills - - JavaScript AI 营销技能
44 shanraisshan/claude-code-best-practice - - HTML Claude Code 最佳实践
45 ComposioHQ/awesome-codex-skills - - Python Codex 技能精选
46 alchaincyf/nuwa-skill - - Python 女娲 AI 编程技能
47 mvanhorn/last30days-skill - - Python AI Agent 跨平台研究技能,覆盖 Reddit/X/YouTube/HN 等
48 op7418/guizang-ppt-skill - - HTML 归藏 PPT 生成技能
49 mukul975/Anthropic-Cybersecurity-Skills - - Python 754 个结构化 AI 网络安全技能,映射 5 大安全框架
50 simplifaisoul/osiris - - TypeScript Osiris AI Agent
51 nextlevelbuilder/ui-ux-pro-max-skill - - Python UI/UX Pro Max 技能
52 K-Dense-AI/scientific-agent-skills - - Python 科研 Agent 技能
53 Fission-AI/OpenSpec - - TypeScript 开放规格工具
54 jamiepine/voicebox - - TypeScript 语音处理工具
55 router-for-me/CLIProxyAPI - - Go CLI 代理 API
56 crynta/terax-ai - - TypeScript Terax AI
57 voltAgent/awesome-agent-skills - - - Agent 技能精选
58 vercel-labs/skills - - TypeScript Vercel 官方 AI 技能
59 millionco/react-doctor - - TypeScript React 诊断工具
60 neilsonnn/image-blaster - - TypeScript 图像处理工具
61 truelockmc/streambert - - JavaScript 流媒体工具

🧠 AI Agent 框架与平台

# 项目 ⭐ Stars Fork 语言 说明
1 unicity-astrid/astrid - - Rust 面向 AI Agent 的操作系统
2 datawhalechina/hello-agents 1,162 121 Python 《从零开始构建智能体》—— 原理与实践教程
3 TauricResearch/TradingAgents 1,144 249 Python 多 Agent LLM 金融交易框架
4 CloakHQ/CloakBrowser 1,853 150 Python 隐身 Chromium 浏览器,通过所有机器人检测测试,30/30 测试通过
5 Fincept-Corporation/FinceptTerminal - - Python 金融终端 Agent
6 rmyndharis/OpenWA - - TypeScript OpenWA 工具
7 TwilitRealm/dusklight - - C++ Dusklight 项目
8 withcoral/coral - - Rust Coral AI 项目
9 soxoj/maigret - - Python 用户名 OSINT 工具
10 jackwener/OpenCLI - - JavaScript 开源 CLI 工具
11 warpdotdev/warp - - - Warp 终端

🗣️ AI 语音/多模态

# 项目 ⭐ Stars Fork 语言 说明
1 OpenBMB/VoxCPM - - Python VoxCPM2:无分词器的多语言语音生成 TTS,支持创意声音设计和逼真克隆
2 Open-LLM-VTuber/open-LLM-VTuber - - Python 与任意 LLM 免手式语音交互,支持语音打断和 Live2D 面部追踪
3 ruvnet/RuView 1,307 166 Rust 利用 WiFi 信号实现实时空间智能、生命体征监测和存在检测,无需摄像头
4 AIDC-AI/Pixelle-Video - - Python 视频生成/编辑 AI 工具
5 supertone-inc/supertonic - - Swift 音频/语音处理工具
6 heygen-com/hyperframes - - TypeScript 写 HTML 渲染视频,为 Agent 构建
7 debpalash/OmniVoice-Studio - - Python 全能语音工作室

💡 AI 应用(金融/办公/教育/研究)

# 项目 ⭐ Stars Fork 语言 说明
1 hugohe3/ppt-master - - Python AI 从任意文档生成可编辑的 PPTX 文件,真正的 PowerPoint 形状而非图片
2 ZhuLinsen/daily_stock_analysis - - Python LLM 驱动的 A/H/美股智能分析,多数据源行情+实时新闻+LLM 决策仪表盘
3 HKUDS/Vibe-Trading - - Python 个人交易 Agent
4 HKUDS/AI-Trader - - Python AI 交易系统
5 HKUDS/ViMax - - Python 可视化最大化工具
6 HKUDS/CLI-Anything - - Python CLI 万物工具
7 harry0703/MoneyPrinterTurbo - - Python AI 视频生成赚钱工具
8 Yuan1z0825/nature-skills - - Python 符合 Nature 论文学术表达和科研绘图的 Skill
9 JuliusBrussee/caveman - - Python Caveman 工具
10 datawhalechina/easy-vibe - - JavaScript Datawhale 轻量 Vibe 编程教程
11 Wei-Shaw/sub2api - - Go 订阅转 API 工具
12 Tencent/TencentDB-Agent-Memory - - TypeScript 腾讯云数据库 Agent 记忆系统
13 QuantumNous/new-api - - Go 新 API 管理
14 MadsLorentzen/ai-job-search - - TypeScript AI 驱动的求职框架,基于 Claude Code 构建
15 santifer/career-ops - - JavaScript AI 求职运营工具
16 Anil-matcha/Open-Generative-AI - - JavaScript 开源生成式 AI 集合
17 floci-io/floci - - Java Floci 项目

🔧 非 AI 热门 / 基础设施

# 项目 ⭐ Stars Fork 语言 说明
1 antirez/ds4 1,369 121 C DeepSeek 4 Flash 本地推理引擎,支持 Metal 和 CUDA
2 D4Vinci/Scrapling - - Python 智能自适应网页爬虫
3 supermemoryai/supermemory - - TypeScript 极速可扩展的记忆引擎,AI 时代的记忆 API
4 multica-ai/multica - - TypeScript Multica AI 项目
5 yikart/AiToEarn - - TypeScript AI 赚钱工具
6 ChromeDevTools/chrome-devtools-mcp - - TypeScript Chrome DevTools MCP 服务
7 vercel-labs/zero-native - - Zig Vercel Zero 原生客户端
8 vercel-labs/zero - - C Vercel Zero 项目
9 bytedance/UI-TARS-desktop - - TypeScript 字节跳动 GUI Agent 桌面版
10 Crosstalk-Solutions/project-nomad - - TypeScript 离线生存计算机,集成关键工具、知识和 AI
11 manaflow-ai/cmux - - JavaScript Manaflow CMUX
12 nexu-io/html-anything - - HTML HTML 万物工具
13 abhigyanpatwari/GitNexus - - TypeScript Git 关联工具
14 lfnovo/open-notebook - - TypeScript 开放笔记本

🎯 月榜核心洞察

  • AI Coding Agent 技能大爆发:榜单前 30 名几乎全是 Claude Code / Codex 技能项目,反映 AI 编程助手生态正在高速增长
  • Anthropic 官方生态扩张:anthropics/financial-services、anthropics/claude-plugins-official、anthropics/knowledge-work-plugins、anthropics/claude-for-legal 四个官方仓库上榜
  • Hermes Agent 生态崛起:NousResearch/hermes-agent (3,576⭐) 位居第 3,多个周边项目上榜(WebUI、Desktop 等)
  • antirez/ds4 亮点:Redis 作者 antirez 的 DeepSeek 4 Flash 本地推理引擎,用 C 语言实现,支持 Metal/CUDA
  • 知识图谱技能成为新趋势:colbymchenry/codegraph、Lum1104/Understand-Anything、safishamsi/graphify 等多个知识图谱相关项目上榜
  • 语言分布:Python (32%)、TypeScript (28%)、Rust (10%)、Shell (6%)、JavaScript (8%)、其他 (16%)

📅 周榜(2026-06-06)

数据来源:OSSInsight Trending | 100 个项目 | 总计 6,441 Stars

按 AI 方向分类:

🤖 AI Coding Agent / AI 编程助手

# 项目 ⭐ Stars Fork 语言 说明
1 pewdiepie-archdaemon/odysseus 1,526 145 JavaScript 自托管 AI 工作区
2 chopratejas/headroom 371 15 Python 压缩工具输出/日志/RAG 内容,减少 60-95% Token 消耗,保持相同答案质量
3 colbymchenry/codegraph 266 6 TypeScript 预索引代码知识图谱,支持 Claude Code、Codex、Gemini、Cursor 等
4 Lum1104/Understand-Anything 196 9 TypeScript 将任何代码转化为可交互的知识图谱,支持多款 AI 编程工具
5 Leonxlnx/taste-skill 136 6 - 高级前端技能,让 AI 拥有好品味,避免生成无聊的设计
6 nesquena/hermes-webui 136 9 Python Hermes Agent 的 Web 和手机端最佳使用方式
7 rohitg00/ai-engineering-from-scratch 107 12 Python 从零开始学 AI 工程:学习、构建、发布
8 safishamsi/graphify 79 3 Python AI 编程助手技能,将代码/SQL/文档/视频转为可查询知识图谱
9 Imbad0202/academic-research-skills 80 7 Python Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿
10 pbakaus/impeccable 80 3 JavaScript 让 AI 工具在设计中表现更好的设计语言
11 heygen-com/hyperframes 77 2 TypeScript 写 HTML 渲染视频,为 Agent 构建
12 MadsLorentzen/ai-job-search 61 13 TypeScript AI 驱动的求职框架,基于 Claude Code,自动评估职位、定制简历和面试准备
13 Yuan1z0825/nature-skills 68 3 Python 符合 Nature 论文学术表达和科研绘图的 Skill
14 rtk-ai/rtk 63 5 Rust CLI 代理,可将常用开发命令的 LLM Token 消耗降低 60-90%
15 can1357/oh-my-pi 61 4 TypeScript 终端 AI 编程 Agent,支持哈希锚定编辑、LSP、Python、浏览器等
16 fathah/hermes-desktop 55 6 TypeScript Hermes Agent 的桌面伴侣
17 revfactory/harness 57 6 HTML 设计领域特定 Agent 团队并生成对应技能的元技能
18 KKKKhazix/khazix-skills 54 3 Python 数字生命卡兹克开源的 AI Skills 合集
19 mvanhorn/last30days-skill 44 3 Python AI Agent 跨平台研究技能,覆盖 Reddit/X/YouTube/HN/Polymarket 等
20 hugohe3/ppt-master 49 7 Python AI 从任意文档生成可编辑的 PPTX,真正的 PowerPoint 形状
21 mukul975/Anthropic-Cybersecurity-Skills 47 5 Python 754 个结构化 AI 网络安全技能,映射 5 大安全框架
22 rohitg00/agentmemory 47 2 TypeScript 基于实际基准测试排名第一的 AI 编程 Agent 持久记忆
23 supermemoryai/supermemory 83 9 TypeScript 极速可扩展的 AI 时代记忆引擎和 API
24 greensock/gsap-skills 50 3 - GSAP 官方 AI 技能,教授 AI 编程 Agent 正确使用 GSAP
25 Crosstalk-Solutions/project-nomad 44 4 TypeScript 离线生存计算机,集成关键工具、知识和 AI
26 tinyhumansai/openhuman - - Rust 个人 AI 超级智能,私有、简单且强大
27 CloakHQ/CloakBrowser - - Python 隐身 Chromium 浏览器,通过所有机器人检测测试
28 datawhalechina/hello-agents - - Python 《从零开始构建智能体》—— 原理与实践教程
29 shareAI-lab/learn-claude-code - - Python Claude Code 学习教程
30 Alishahryar1/free-claude-code - - Python 免费 Claude Code 使用方案
31 tashfeenahmed/freellmapi - - TypeScript 免费 LLM API 访问
32 Hmbown/CodeWhale - - Rust 面向开源模型的编程 Agent
33 garrytan/gbrain - - TypeScript Garry Tan 的 AI 大脑工具
34 op7418/guizang-ppt-skill - - HTML 归藏 PPT 生成技能
35 EveryInc/compound-engineering-plugin - - TypeScript 复合工程插件
36 decolua/9router - - JavaScript 免费 AI 编程无限使用,连接多款工具到免费 API
37 anthropics/financial-services - - Python Anthropic 官方金融服务技能
38 multica-ai/multica - - TypeScript Multica AI 项目
39 addyosmani/agent-skills - - Shell 生产级 AI 编程 Agent 工程技能
40 alchaincyf/nuwa-skill - - Python 女娲 AI 编程技能
41 alchaincyf/huashu-design - - HTML 华数设计技能
42 anthropics/knowledge-work-plugins - - Python Anthropic 官方知识工作插件
43 AgriciDaniel/claude-seo - - Python Claude SEO 技能
44 shanraisshan/claude-code-best-practice - - HTML Claude Code 最佳实践
45 HKUDS/CLI-Anything - - Python CLI 万物工具
46 rmyndharis/OpenWA - - TypeScript OpenWA 工具
47 K-Dense-AI/scientific-agent-skills - - Python 科研 Agent 技能
48 manaflow-ai/cmux - - JavaScript Manaflow CMUX
49 abhigyanpatwari/GitNexus - - TypeScript Git 关联工具
50 ConardLi/garden-skills - - CSS 前端花园技能集
51 router-for-me/CLIProxyAPI - - Go CLI 代理 API
52 VoltAgent/awesome-agent-skills - - - Agent 技能精选
53 Tencent/TencentDB-Agent-Memory - - TypeScript 腾讯云数据库 Agent 记忆系统
54 vectorize-io/hindsight - - Python Hindsight 回溯工具
55 millionco/react-doctor - - TypeScript React 诊断工具
56 nexu-io/html-anything - - HTML HTML 万物工具
57 crynta/terax-ai - - TypeScript Terax AI

🧠 AI Agent 框架与平台

# 项目 ⭐ Stars Fork 语言 说明
1 unicity-astrid/astrid 287 0 Rust 面向 AI Agent 的操作系统
2 ogulcancelik/herdr - - Rust Herdr Agent 工具
3 AlexsJones/llmfit - - Rust LLM 适配工具
4 openclaw/openclaw-windows-node - - C# OpenClaw Windows 节点
5 mindfold-ai/Trellis - - TypeScript Trellis AI 框架
6 reconurge/flowsint - - TypeScript Flowsint 工具
7 0-AI-UG/cate - - TypeScript Cate AI 工具
8 microsoft/agent-governance-toolkit - - Python 微软 Agent 治理工具包

🗣️ AI 语音/多模态

# 项目 ⭐ Stars Fork 语言 说明
1 OpenBMB/VoxCPM 119 8 Python VoxCPM2:无分词器的多语言 TTS,支持声音设计和克隆
2 Open-LLM-VTuber/open-LLM-VTuber 73 5 Python 与任意 LLM 免手式语音交互,支持 Live2D
3 debpalash/OmniVoice-Studio - - Python 全能语音工作室
4 echo-loop/Echo-Loop - - Dart Echo Loop 语音工具
5 microsoft/VibeVoice - - Python 微软 VibeVoice 语音工具
6 AIDC-AI/Pixelle-Video - - Python 视频生成/编辑 AI 工具

💡 AI 应用(金融/办公/教育/研究)

# 项目 ⭐ Stars Fork 语言 说明
1 ZhuLinsen/daily_stock_analysis 51 32 Python LLM 驱动的 A/H/美股智能分析,零成本定时运行
2 HKUDS/Vibe-Trading 55 8 Python 个人交易 Agent
3 datawhalechina/easy-vibe - - JavaScript Datawhale 轻量 Vibe 编程教程
4 datawhalechina/Agent-Learning-Hub - - HTML Datawhale Agent 学习中心
5 p-e-w/heretic - - Python Heretic 项目
6 shiyu-coder/Kronos - - Python Kronos 时间工具
7 Wei-Shaw/sub2api - - Go 订阅转 API 工具
8 MaxMiksa/Auto-Company - - Python 自动公司 Agent
9 FareedKhan-dev/train-llm-from-scratch - - Jupyter Notebook 从零训练 LLM 教程
10 lfnovo/open-notebook - - TypeScript 开放笔记本
11 nashsu/llm_wiki - - TypeScript LLM 百科
12 koala73/worldmonitor - - TypeScript 世界监控工具
13 wbh604/UZI-Skill - - Python UZI 技能

🔧 非 AI 热门 / 基础设施

# 项目 ⭐ Stars Fork 语言 说明
1 thcp/stemdeck - - JavaScript Stemdeck 工具
2 opensquilla/opensquilla - - Python OpenSquilla 开源项目
3 opendataloader-project/opendataloader-pdf - - Java 开放数据加载器 PDF
4 getpaseo/paseo - - TypeScript Paseo 项目
5 run-llama/liteparse - - Rust LlamaIndex 轻量解析器
6 iOfficeAI/OfficeCLI - - C# 办公 AI CLI
7 webadderallorg/Recordly - - TypeScript Recordly 记录工具
8 withastro/flue - - TypeScript Astro Flue 项目
9 Leey21/awesome-ai-research-writing - - - AI 研究写作精选
10 helloianneo/ian-xiaohei-illustrations - - - 小黑插画
11 JCodesMore/ai-website-cloner-template - - TypeScript AI 网站克隆模板
12 vercel-labs/skills - - TypeScript Vercel 官方 AI 技能
13 blader/humanizer - - - Humanizer 人性化工具
14 codebymitch/TitanBot - - JavaScript TitanBot 机器人
15 darrylmorley/whatcable - - Swift WhatCable 线缆识别工具
16 github/app - - - GitHub App

🎯 周榜核心洞察

  • OSSInsight 周榜以 AI Coding Agent 技能 为绝对主流(占比约 60%),与 GitHub Trending 有大量重叠
  • GitHub Trending 更多关注大型基础设施项目,而 OSSInsight 更偏重 社区活跃度驱动的小型技能项目
  • 大量项目为 Claude Code / Codex 的 Skill 文件,反映了 AI 编程助手生态的爆发式增长

OSSInsight 独家发现的项目

  • unicity-astrid/astrid:AI Agent 操作系统(Rust),概念独特
  • OpenBMB/VoxCPM:无分词器的多语言 TTS 系统,中文团队项目
  • microsoft/VibeVoice:微软的语音交互项目
  • microsoft/agent-governance-toolkit:微软 Agent 治理工具包
  • Tencent/TencentDB-Agent-Memory:腾讯云数据库 Agent 记忆系统
  • openclaw/openclaw-windows-node:OpenClaw Windows 节点
  • datawhalechina/hello-agents:Datawhale 智能体教程
  • ZhuLinsen/daily_stock_analysis:LLM 驱动的 A/H/美股智能分析

语言分布趋势

  • Python (30%):AI 技能和教育项目的首选语言
  • TypeScript (28%):Agent 工具和 Web UI 的主力
  • Rust (10%):高性能 Agent 和系统工具,增长迅速
  • JavaScript (8%):Web 和自动化工具
  • Shell (5%):配置和技能文件
  • 其他:Go、Java、C#、Dart、Zig、C、C++ 等

关键趋势

  1. AI Skill 经济:Claude Code / Codex 技能项目占据榜单半壁江山,形成新的开源生态
  2. Agent 记忆与持久化:rohitg00/agentmemory、supermemoryai/supermemory、Tencent/TencentDB-Agent-Memory 等多个项目关注 Agent 记忆
  3. 知识图谱:codegraph、Understand-Anything、graphify 等知识图谱工具成为热门方向
  4. 中国团队活跃:datawhalechina、Tencent、OpenBMB、HKUDS 等多个中国团队项目上榜

采集时间:2026-06-06 05:33 CST | 数据源:HF Trending Models

# 模型 任务 参数量 下载量 点赞 亮点
1 nvidia/LocateAnything-3B 图文转文本 4B 102k 1.37k NVIDIA 定位万物模型,视觉定位能力突出
2 google/gemma-4-12B-it 多模态 12B 143k 537 Google Gemma 4 指令微调版,支持多模态输入
3 unsloth/gemma-4-12b-it-GGUF 图文转文本 12B 296k 365 Gemma 4 GGUF 量化版,适配本地部署
4 HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 图文转文本 35B 2.69M 1.45k Qwen3.6 无审查版,激进去安全对齐,下载量极高
5 google/gemma-4-12B 多模态 12B 53.5k 332 Gemma 4 基座模型,开源多模态
6 LiquidAI/LFM2.5-8B-A1B 文本生成 8B 82.7k 526 LiquidAI 新架构语言模型,1小时前刚更新
7 sapientinc/HRM-Text-1B 文本生成 1B 159k 702 超轻量文本模型,下载量表现亮眼
8 ideogram-ai/ideogram-4-fp8 文本转图像 1.25k 267 Ideogram 4 图像生成 fp8 量化版
9 JetBrains/Mellum2-12B-A2.5B-Thinking 文本生成 12B 14.7k 221 JetBrains 代码模型,带思维链推理能力
10 stepfun-ai/Step-3.7-Flash 图文转文本 201B 27.9k 330 阶跃星辰 Step 3.7 Flash,超大参数多模态模型
11 openbmb/MiniCPM5-1B 文本生成 1B 91.2k 770 面壁智能 MiniCPM5,端侧小模型新标杆
12 ideogram-ai/ideogram-4-nf4 文本转图像 1.59k 190 Ideogram 4 极低比特量化版
13 nvidia/Qwen3.6-35B-A3B-NVFP4 文本生成 19B 822k 189 NVIDIA 量化版 Qwen3.6,MoE 架构激活参数仅3B
14 nvidia/Cosmos3-Nano 16B 21.6k 176 NVIDIA Cosmos3 世界模型 Nano 版
15 deepseek-ai/DeepSeek-V4-Pro 文本生成 862B 5.56M 4.66k DeepSeek V4 旗舰版,超大规模 MoE,点赞数断层领先
16 nvidia/nemotron-3.5-asr-streaming-0.6b 语音识别 597 188 NVIDIA 流式语音识别模型,支持实时推理
17 nvidia/Cosmos3-Super 65B 19.2k 142 NVIDIA Cosmos3 世界模型 Super 版
18 PaddlePaddle/PaddleOCR-VL-1.6 图文转文本 1.0B 6.88k 244 百度飞桨 OCR 视觉语言模型,12小时前更新
19 ByteDance/Bernini-R 图文转视频 175 138 字节跳动图生视频模型
20 nvidia/PiD 图像转图像 901 310 NVIDIA 图像处理模型

🎯 核心洞察

参数量分布趋势

  • 小模型(<10B)霸榜:Top 20 中有 8 个模型参数量 ≤10B(1B×3, 4B, 5B, 8B, 9B, 16B),端侧部署是明确趋势
  • 超大模型仍有市场:DeepSeek-V4-Pro(862B)、Step-3.7-Flash(201B)、Nemotron-3-Ultra(561B)证明旗舰模型仍有强需求
  • MoE 架构流行:Qwen3.6-35B-A3B、LFM2.5-8B-A1B、DeepSeek-V4 系列均采用 MoE,以较少激活参数实现高性能

任务类型分布

  • 文本生成/语言模型(6个):仍是主力赛道
  • 多模态(图文理解/生成)(7个):Any-to-Any、Image-Text-to-Text 成为主流
  • 图像生成(3个):Ideogram 4 系列、Cosmos3 Text2Image
  • 视频生成(2个):Sulphur-2、Bernini-R
  • 语音(2个):TTS 和 ASR 各一
  • 世界模型(2个):NVIDIA Cosmos3 系列异军突起

厂商格局

  • NVIDIA 占据主导:Top 20 中占据 8 个席位(LocateAnything、Qwen3.6量化版、Cosmos3×3、Nemotron×2、PiD),从训练到推理全链路布局
  • 国产模型强劲:DeepSeek V4 系列点赞断层领先,阶跃星辰 Step-3.7-Flash、面壁 MiniCPM5、百度 PaddleOCR-VL、字节 Bernini-R 均上榜,共占 6 席(30%)
  • Google Gemma 4 刚发布即爆发:12B 模型及其 GGUF 量化版同时上榜

热点趋势

  • 量化模型需求旺盛:fp8、nf4、GGUF、NVFP4 等量化版本频繁出现,本地部署需求强劲
  • 无审查模型关注度极高:Qwen3.6 无审查版下载量达 269 万,反映社区对去安全对齐的强烈需求
  • 世界模型成为新赛道:NVIDIA Cosmos3 系列三个变体同时上榜,物理世界模拟是新兴方向

采集时间:2026-06-06 05:39 CST | 数据源:HF Trending + 6月月榜


📅 月榜 Top 20(2026年6月)

# 论文标题 👍 方向 作者/机构 GitHub ⭐ 亮点
1 Crafter: A Multi-Agent Harness for Editable Scientific Figure Generation from Diverse Inputs(Crafter:面向多源输入的可编辑科学图表生成多智能体框架) 189 多智能体 / 科学图表生成 Liang Chen, Zheng Wang 等(9位作者) 85 多智能体协作生成可编辑科学图表,支持多样化输入格式
2 On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters(参数高效微调的规模化:迈向万亿参数百万个性化模型) 174 参数高效微调 / 个性化模型 Mind Lab(韩国) 探索万亿参数模型的百万级个性化 PEFT 方案,极限扩展
3 Domino: Decoupling Causal Modeling from Autoregressive Drafting in Speculative Decoding(Domino:推测解码中因果建模与自回归草稿的解耦) 139 推测解码 / 推理加速 上海交通大学(SJTU) 42 解耦因果建模与自回归起草,大幅提升推理速度
4 COLLEAGUE.SKILL: Automated AI Skill Generation via Expert Knowledge Distillation(COLLEAGUE.SKILL:基于专家知识蒸馏的自动化AI技能生成) 105 AI智能体技能 / 知识蒸馏 上海AI实验室(Shanghai AI Lab) 19k 从异构轨迹自动蒸馏AI技能,可检查可纠正
5 GrepSeek: Training Search Agents for Direct Corpus Interaction(GrepSeek:训练搜索智能体直接与语料库交互) 102 搜索智能体 / 信息检索 马萨诸塞大学阿默斯特分校(UMass Amherst) 36 训练搜索智能体直接与语料库交互,绕过传统检索瓶颈
6 Audio Interaction Model(音频交互模型) 99 多模态音频 / 流式交互 新加坡国立大学(NUS) 103 统一流式音频模型,支持离线任务执行与实时音频指令跟随
7 Cosmos 3: Omnimodal World Models for Physical AI(Cosmos 3:面向物理AI的全模态世界模型) 83 世界模型 / 全模态 NVIDIA 9.37k 混合Transformer统一架构处理和生成多种数据类型
8 OCC-RAG: Optimal Cognitive Core for Faithful Question Answering(OCC-RAG:面向忠实问答的最优认知核心) 83 RAG / 问答系统 OCC AI 23 最优认知核心提升RAG系统忠实度
9 Trust-Region Behavior Blending for On-Policy Distillation(基于信赖域的行为混合策略蒸馏) 64 模型蒸馏 / 策略优化 T-Tech(TikTok/字节跳动) 4 信赖域方法实现策略蒸馏,保持行为一致性
10 A Matter of TASTE: Improving Coverage and Difficulty of Agent Benchmarks(TASTE:提升智能体基准测试的覆盖率和难度) 63 智能体评测 / 基准测试 以色列理工学院(Technion) 4 提出更全面的智能体评测方法,覆盖更多任务难度
11 Masking Stale Observations Helps Search Agents – Until It Doesn’t(遮蔽过时观测有助于搜索智能体——但也有极限) 60 搜索智能体 / 优化策略 McAuley Lab(UCSD) 揭示遮蔽过时观测对搜索智能体的双重效应
12 Representation Forcing for Bottleneck-Free Unified Multimodal Models(面向无瓶颈统一多模态模型的表征强制) 57 多模态模型 / 表征学习 字节跳动Seed(ByteDance-Seed) 消除多模态模型信息瓶颈,统一架构
13 SwanVoice: Expressive Long-Form Zero-Shot Speech Synthesis(SwanVoice:富有表现力的长文本零样本语音合成) 56 语音合成 / 零样本 字节跳动(ByteDance) 零样本长文本富有表现力的语音合成
14 K-BrowseComp: A Web Browsing Agent Benchmark Grounded in Korean Contexts(K-BrowseComp:基于韩语语境的网页浏览智能体基准) 52 智能体评测 / 网页浏览 卡内基梅隆大学(CMU) 韩语语境下的网页浏览智能体评测基准
15 Mellum2 Technical Report(Mellum2 技术报告) 52 代码模型 / LLM JetBrains JetBrains新一代代码大模型
16 From Activation to Causality: Discovery of Causal Visual Representations in the Human Brain(从激活到因果:人脑因果视觉表征的发现) 51 神经科学 / 视觉表征 麻省理工学院(MIT) 揭示人脑中的因果视觉表征机制
17 KVarN: Variance-Normalized KV-Cache Quantization(KVarN:方差归一化KV缓存量化) 50 KV缓存量化 / 推理优化 华为(Huawei CSL) 284 无标定KV缓存量化器,减少推理误差累积
18 Where Do Deep-Research Agents Go Wrong? Span-Level Error Localization(深度研究智能体错在哪?跨度级错误定位) 49 智能体诊断 / 深度研究 南京大学 NJU-LINK 定位深度研究智能体的错误位置
19 Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses(Harness-1:面向搜索智能体的强化学习状态外化框架) 42 搜索智能体 / 强化学习 ChromaDB 强化学习驱动的搜索智能体,状态外化提升效果
20 Trust Region On-Policy Distillation(信赖域在线策略蒸馏) 41 模型蒸馏 / 策略优化 三星研究院(Samsung Research) 信赖域方法实现高效策略蒸馏

📅 月榜 21-50(精选)

# 论文标题 👍 方向 作者/机构 亮点
21 GGT-100K: Generative Ground Truth for Generalizable Real-World Image Restoration(GGT-100K:面向通用真实世界图像修复的生成式真值) 41 图像修复 / 数据集 香港理工大学 VCLab 10万生成式图像修复真值数据集
22 LongTraceRL: Learning Long-Context Reasoning from Search Agent Trajectories(LongTraceRL:从搜索智能体轨迹学习长上下文推理) 41 长上下文推理 / RL 清华大学 KEG 基于评分奖励从搜索轨迹学习长上下文推理
23 ArcANE: Do Role-Playing Language Agents Stay in Character at the Right Time?(ArcANE:角色扮演语言智能体是否在正确时间保持角色?) 40 角色扮演智能体 / 评测 首尔国立大学 评测角色扮演智能体的角色保持能力
24 Function2Scene: 3D Indoor Scene Layout from Functional Specifications(Function2Scene:从功能规格生成3D室内场景布局) 40 3D场景生成 功能驱动的3D室内场景布局生成
25 Code2LoRA: Hypernetwork-Generated Adapters for Code Language Models(Code2LoRA:超网络生成代码模型适配器) 39 代码模型 / 适配器 滑铁卢大学(UWaterloo) 超网络自动生成代码模型LoRA适配器
26 Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking(Humanoid-GPT:零样本运动跟踪的数据与结构扩展) 38 人形机器人 / 运动跟踪 大规模数据驱动零样本人形运动跟踪
27 Reproducing, Analyzing, and Detecting Reward Hacking in Rubric-Based RL(基于评分标准的强化学习奖励作弊复现、分析与检测) 37 RLHF / 奖励作弊 系统性分析强化学习中的奖励作弊问题
28 Towards Streaming Synchronized Spatial Audio Generation(面向流式同步空间音频生成) 36 音频生成 / 流式推理 浙江大学(ZJU) 自回归扩散Transformer实现流式空间音频
29 dMoE: dLLMs with Learnable Block Experts(dMoE:可学习块专家的扩散语言模型) 36 扩散语言模型 / MoE 扩散语言模型与可学习块专家混合
30 SANA-Streaming: Real-time Streaming Video Editing with Hybrid Diffusion Transformer(SANA-Streaming:混合扩散Transformer实时流式视频编辑) 36 视频编辑 / 流式推理 NVIDIA 混合扩散架构实现实时流式视频编辑
31 TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration(TIDE:模板引导迭代式主动多问题发现) 35 智能体 / 问题发现 KAIST AI 模板引导的主动多问题发现框架
32 Task-Focused Memorization for Multimodal Agents(面向任务的多模态智能体记忆) 33 多模态智能体 / 记忆 字节跳动Seed 任务导向的多模态智能体记忆机制
33 NITP: Next Implicit Token Prediction for LLM Pre-training(NITP:LLM预训练的下一代隐式Token预测) 33 LLM预训练 / Token预测 上海交通大学 SAI 隐式Token预测提升LLM预训练效果
34 X-Stream: Exploring MLLMs as Multiplexers for Multi-Stream Understanding(X-Stream:多模态LLM作为多流理解的多路复用器) 32 多模态理解 / 流式处理 将MLLM作为多流理解的多路复用器
35 Qwen-Image-Flash: Beyond Objective Design(Qwen-Image-Flash:超越目标设计) 30 视觉语言模型 Qwen(阿里通义) 通义千问图像Flash版本
36 World Models Meet Language Models: On the Complementarity of Concrete and Abstract Reasoning(世界模型遇上语言模型:具体与抽象推理的互补性) 29 世界模型 / 推理 腾讯(Tencent) 探索世界模型与语言模型的推理互补性
37 VLMs are Good Teachers for Video Reasoning via Adaptive Test-Time Optimization(VLM通过自适应测试时优化教导视频推理) 29 视频推理 / 测试时优化 快手 KlingTeam VLM作为教师指导视频推理
38 AutoLab: Can Frontier Models Solve Long-Horizon Auto Research and Engineering Tasks?(AutoLab:前沿模型能否解决长周期自动研究与工程任务?) 26 自动化研究 / 智能体 评测前沿模型在长周期自动研究任务中的能力
39 VideoMLA: Low-Rank Latent KV Cache for Minute-Scale Autoregressive Video Diffusion(VideoMLA:面向分钟级自回归视频扩散的低秩潜在KV缓存) 26 视频生成 / KV缓存优化 低秩潜在KV缓存实现分钟级视频扩散
40 VLM3: Vision Language Models Are Native 3D Learners(VLM3:视觉语言模型天生就是3D学习者) 25 3D理解 / VLM Meta FAIR 简单架构修改让VLM原生支持3D理解
41 Streaming Communication in Multi-Agent Reasoning(多智能体推理中的流式通信) 25 多智能体 / 流式推理 流式中间结果传递提升多智能体推理效率
42 Echo-Infinity: Learning Evolving Memory for Real-Time Infinite Video Generation(Echo-Infinity:实时无限视频生成的可学习进化记忆) 25 视频生成 / 无限生成 可学习进化记忆实现实时无限视频生成
43 ThoughtFold: Folding Reasoning Chains via Introspective Preference Learning(ThoughtFold:通过内省偏好学习折叠推理链) 24 推理优化 / 偏好学习 InternLM(上海AI实验室) 内省偏好学习压缩推理链
44 SAAS: Self-Aware Reinforcement Learning for Over-Search Mitigation(SAAS:面向过度搜索缓解的自我感知强化学习) 24 智能体搜索 / RL 厦门大学(XMU) 自我感知RL缓解智能体过度搜索
45 Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories(语言模型需要睡眠:学习自我修改和巩固记忆) 23 记忆机制 / 持续学习 Google 类睡眠机制让LLM自我修改和巩固记忆

# 论文标题 👍 方向 GitHub ⭐ 亮点
1 TradingAgents: Multi-Agents LLM Financial Trading Framework(TradingAgents:多智能体LLM金融交易框架) 86 金融交易 / 多智能体 83.1k 🔥 模拟真实交易公司的多智能体LLM股票交易框架
2 PaddleOCR-VL-1.6: Expanding the Frontier of Document Parsing(PaddleOCR-VL-1.6:拓展文档解析前沿) 13 文档解析 / OCR 80.3k 🔥 百度PaddleOCR视觉语言版,文档解析SOTA
3 Efficient Memory Management for Large Language Model Serving with PagedAttention(PagedAttention:LLM服务高效内存管理) 58 LLM推理 / 内存管理 82k 🔥 vLLM核心PagedAttention算法,KV缓存高效管理
4 LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models(LlamaFactory:100+语言模型统一高效微调) 183 模型微调 / 工具 71.9k 🔥 统一微调框架,Web界面支持100+模型
5 DataFlow: An LLM-Driven Framework for Unified Data Preparation(DataFlow:LLM驱动的统一数据准备框架) 222 数据工程 / 自动化 4.56k 🔥 LLM驱动数据质量提升与自动化流水线
6 SkillOpt: Executive Strategy for Self-Evolving Agent Skills(SkillOpt:自进化智能体技能的执行策略) 221 智能体技能 / 自进化 5.06k 🔥 微软出品,文本空间技能优化器,零推理开销
7 WebWatcher: Breaking New Frontier of Vision-Language Deep Research Agent(WebWatcher:视觉语言深度研究智能体新突破) 143 深度研究 / 多模态智能体 19.3k 阿里巴巴出品,视觉语言深度研究智能体
8 VibeVoice Technical Report(VibeVoice技术报告) 171 语音合成 / 多说话人 48.2k 微软出品,下一token扩散+连续语音分词器
9 MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing(MinerU2.5:高效高分辨率文档解析解耦视觉语言模型) 165 文档解析 / VLM 66.6k 1.2B参数的轻量文档解析VLM,粗到细策略
10 SmolDocling: An Ultra-Compact Vision-Language Model for End-to-End Multi-Modal Document Conversion(SmolDocling:端到端多模态文档转换的超紧凑VLM) 161 文档转换 / VLM 61k IBM出品,仅256M参数的端到端文档转换模型
11 ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration(ARIS:对抗式多智能体协作的自主研究) 127 自动化研究 / 多智能体 11.5k 上海交大出品,跨模型对抗协作实现可靠研究
12 Scaling Agents via Continual Pre-training(通过持续预训练扩展智能体) 117 智能体预训练 / 持续学习 19.3k 阿里巴巴AgentFounder,智能体持续预训练SOTA
13 COLLEAGUE.SKILL: Automated AI Skill Generation(COLLEAGUE.SKILL:自动化AI技能生成) 105 智能体技能 / 知识蒸馏 19k 上海AI实验室,异构轨迹蒸馏AI技能
14 Kronos: A Foundation Model for the Language of Financial Markets(Kronos:金融市场语言基础模型) 38 金融AI / 时序预测 28.6k 金融K线数据专用预训练框架
15 LightRAG: Simple and Fast Retrieval-Augmented Generation(LightRAG:简单快速的检索增强生成) 39 RAG / 知识图谱 36.2k 图结构增强的RAG系统
16 Zep: A Temporal Knowledge Graph Architecture for Agent Memory(Zep:智能体记忆的时序知识图谱架构) 11 智能体记忆 / 知识图谱 27k 时序知识图谱架构的智能体记忆层
17 AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications(AgentScope 1.0:开发者导向的智能体应用框架) 64 智能体框架 / 开发工具 26.2k 阿里巴巴达摩院,ReAct范式智能体开发框架
18 OpenDevin: An Open Platform for AI Software Developers(OpenDevin:AI软件开发者开放平台) 79 AI编程 / 智能体 75.9k 开源AI编程智能体平台
19 DFlash: Block Diffusion for Flash Speculative Decoding(DFlash:用于闪速推测解码的块扩散) 82 推测解码 / 推理加速 4.94k 块扩散模型并行Token起草,显著推理加速
20 Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models(YOLO26:统一实时端到端视觉模型) 5 目标检测 / 实时视觉 58k 最新YOLO版本,无NMS推理+多任务统一

🎯 核心洞察

🏢 机构分布(中国 vs 海外)

机构类型 代表机构 论文数量(约)
🇨🇳 中国 上海AI实验室、上海交大、清华、浙大、北大、南京大学、字节跳动、阿里巴巴、华为、百度、腾讯、快手、厦门大学、复旦 ~50%
🇺🇸 美国 NVIDIA、微软研究院、MIT、CMU、Meta FAIR、Google、UCLA、斯坦福、UIUC ~30%
🌏 其他 新加坡国立大学、KAIST(韩国)、首尔国立大学、以色列理工、ETH苏黎世、华为 ~20%

关键观察:

  • 🇨🇳 中国机构贡献占比极高,尤其在智能体技能(SkillOpt/COLLEAGUE)、蒸馏(Domino)、文档解析(PaddleOCR/MinerU)领域表现突出
  • 🇺🇸 NVIDIA 凭借 Cosmos 3、SANA-Streaming、GRAIL 等多篇文章强势占据世界模型/视频生成赛道
  • 🇨🇳 字节跳动(ByteDance + Seed)在多模态模型、语音合成、视频生成多条线并行推进

🔬 研究方向热度排行

排名 方向 论文数 代表论文
1 🤖 AI智能体(技能/搜索/研究/评测) ~25 SkillOpt, COLLEAGUE.SKILL, GrepSeek, ARIS, AutoLab
2 🎥 视频生成与理解 ~10 Cosmos 3, SANA-Video, Echo-Infinity, LongCat-Video
3 🧠 模型蒸馏与推理加速 ~8 Domino, DFlash, Trust-Region Distillation, KVarN
4 📄 文档解析与OCR ~5 PaddleOCR-VL-1.6, MinerU2.5, SmolDocling
5 🗣️ 语音与音频生成 ~5 VibeVoice, SwanVoice, Audio Interaction, MOSS-TTS
6 🧩 RAG与知识增强 ~4 OCC-RAG, LightRAG, Zep
7 💰 金融AI ~3 TradingAgents, Kronos, AI-Trader
8 🏗️ 世界模型 ~3 Cosmos 3, minWM, stable-worldmodel

关键趋势:

  • 🔥 智能体技能自进化 成为6月最热门方向(SkillOpt 221👍、COLLEAGUE 105👍、DataFlow 222👍)
  • 🔥 推测解码与推理加速 持续升温,多篇蒸馏/量化/并行解码论文上榜
  • 🔥 视频生成从”能生成”到”实时+无限+交互” 演进(Echo-Infinity、SANA-Streaming、minWM)
  • 📈 长上下文推理 成为RL新战场(LongTraceRL、SAAS)

📊 论文→GitHub 转化率 TOP 10

论文 👍 GitHub ⭐ 转化比
TradingAgents 86 83.1k 967x
LlamaFactory 183 71.9k 393x
Kronos 38 28.6k 753x
AgentScope 64 26.2k 409x
VibeVoice 171 48.2k 282x
DataFlow 222 4.56k 21x
SkillOpt 221 5.06k 23x
MinerU2.5 165 66.6k 404x
SmolDocling 161 61k 379x
ARIS 127 11.5k 91x

洞察:

  • 工具型项目(TradingAgents、LlamaFactory、Kronos)转化率极高,开发者社区需求旺盛
  • 研究型论文(DataFlow、SkillOpt)点赞多但Star相对低,学术热度 > 工程落地
  • 文档解析赛道(MinerU、SmolDocling、PaddleOCR)转化率稳定,说明行业刚需强劲

🔥 Hacker News AI 热帖

搜索范围: 4 个搜索词(”AI agent” / “AI coding LLM” / “AI open source model” / “AI tool”)× pastMonth,合并去重后 7 条

📅 月榜

🏆 Tier 1 — 超级爆款(200+ points)

热度 标题 类型 评论 亮点
611 Uber 每月 1500 美元的 AI 使用上限,是 AI 工具定价的有用信号 文章 760 Uber 限制员工 AI 工具月支出上限 $1500,Simon Willison 分析这折射出企业级 AI 工具定价的真实困境——Claude Code 等工具按 token 计费让成本失控
501 斯坦福 CS336 课程 AI Agent 指南 文章 153 斯坦福深度学习课程发布的 CLAUDE.md 文件,详细规定了学生使用 AI Agent(如 Claude)完成作业的准则,引发教育界 AI 使用边界大讨论
386 Show HN: Continue? Y/N — 一款关于 AI Agent 权限疲劳的 60 秒小游戏 Show HN 162 极具创意的互动游戏,模拟不断点击 “允许/拒绝” 来体验 AI Agent 持续请求权限的疲劳感,直击 AI Agent 用户体验痛点
380 AI 编程 Agent 写的代码,必须降低你的维护成本 文章 108 James Shore 的深度文章,论证 AI coding agent 的价值不在于写更多代码,而在于降低维护负担;否则只是加速制造技术债
251 亚马逊员工因 AI 工具使用压力开始「Token 刷量」 新闻 253 亚马逊内部强制推广 AI 工具,员工为达标而 “tokenmaxxing”——用 AI 生成不必要的内容消耗 token,暴露企业 AI 推广的荒诞现实

🥈 Tier 3 — 中等热度(40-100 points)

🥉 Tier 4 — 值得关注(<40 points,新品/有趣项目)

📊 按方向分类汇总

  • AI 工具定价与成本: Uber $1500 月限、亚马逊 tokenmaxxing 事件,企业 AI 工具成本问题成为月度焦点
  • AI Agent 治理与教育: 斯坦福 CS336 发布 AI Agent 使用指南,教育界开始制定 AI 使用规范
  • AI Coding Agent 体验: 权限疲劳游戏引发共鸣,维护成本论点引发深度讨论
  • 开源模型地缘政治: Airbnb CEO 就中国开源模型发表看法

🔥 Hacker News AI 热帖(周榜)

搜索范围: 4 个搜索词(”AI agent” / “AI coding LLM” / “AI open source model” / “AI tool”)× pastWeek,合并去重后 50 条

📅 周榜

🏆 Tier 1 — 超级爆款(200+ points)

热度 标题 类型 评论 亮点
1044 Gemma 4 12B:统一的无编码器多模态模型 新闻 388 Google 发布 Gemma 4 12B,首个无需视觉编码器的统一多模态开源模型,架构创新引发热议,points 破千
611 Uber 每月 1500 美元的 AI 使用上限,是 AI 工具定价的有用信号 文章 760 Simon Willison 分析 Uber 限制 AI 工具支出的深层含义,企业 AI 工具成本问题引发大量讨论
501 斯坦福 CS336 课程 AI Agent 指南 文章 153 斯坦福深度学习课程发布 AI Agent 使用准则,定义了教育场景下 AI 辅助的边界
253 Open Code Review — AI 驱动的代码审查 CLI 工具 Show HN 67 阿里巴巴开源的 AI 代码审查命令行工具,支持多语言,可直接集成 CI/CD 流水线
199 韩国论坛将要求用 AI 审查工具扫描每张图片 新闻 127 韩国通过新规要求在线社区使用 AI 审查工具扫描所有上传图片,隐私与审查争议引爆 HN 讨论
193 Gemma 4 QAT 模型:为移动端和笔记本效率优化的量化感知训练 文章 57 Google 发布 Gemma 4 量化感知训练版本,针对手机和笔记本做了极致压缩优化,端侧 AI 能力再进阶

🥇 Tier 2 — 高热度(100-200 points)

热度 标题 类型 评论 亮点
105 Ask HN: 你的 AI 开发技术栈和工作流是什么? Ask HN 87 社区热议当前 AI 开发工具链选择,涵盖 Claude Code、Cursor、Copilot 等,是了解 AI 开发者生态的绝佳窗口
100 Launch HN: Expanse (YC P26) — 释放闲置 GPU 算力 Launch HN 27 YC P26 项目,搭建平台连接闲置 GPU 资源,为 AI 训练/推理提供低成本算力

🥈 Tier 3 — 中等热度(40-100 points)

热度 标题 类型 评论 亮点
94 微软发布 Scout,基于 OpenClaw 构建的自主 AI Agent 新闻 87 微软发布自主 AI Agent “Scout”,基于 OpenClaw 框架,标志着大厂正式下场 AI Agent 领域
85 AI Agent 现在需要 RSS 能做的事 文章 65 分析 AI Agent 如何需要类似 RSS 的标准协议来获取结构化信息,RSS 的精神在 AI 时代重生
77 Launch HN: Hyper (YC P26) — 驱动 Agentic 开发的公司大脑 Launch HN 76 YC P26 项目,构建”公司大脑”概念,为 Agentic 开发提供统一知识管理和协作平台
75 Sergey Brin 告诉谷歌员工每周工作 60 小时是「最佳平衡点」 新闻 79 Brin 在 AI 竞赛压力下呼吁员工加班,引发科技圈工作文化大讨论
47 Show HN: 形式化验证多边形求交 — Opus 4.8 一次性搞定,之前失败 Show HN 14 用 Claude Opus 4.8 完成之前模型无法搞定形式化验证代码,展示 AI coding 能力跃迁
40 从零构建 AI Agent:Tools 篇 文章 0 实战教程,手把手教你从零构建带工具调用能力的 AI Agent

🥉 Tier 4 — 值得关注(<40 points,新品/有趣项目)

🎯 社区核心信号

  1. Google Gemma 4 引爆开源模型圈:Gemma 4 12B 以”无编码器多模态”架构拿下 1044 points,加上 QAT 量化版本面向端侧部署,Google 在开源模型领域强力出击
  2. 企业 AI 工具成本焦虑全面爆发:Uber 月限 $1500、亚马逊 tokenmaxxing 丑闻、星巴克 AI 库存工具翻车——AI 工具在企业场景的 ROI 问题成为本周最大焦点
  3. AI Agent 生态快速膨胀:微软 Scout、Project Solara、YC P26 密集发布 Agent 项目——大厂和创业公司同时在 AI Agent 赛道发力
  4. AI Agent 基础设施层成型:RSS 协议复兴、Agent 浏览器安全扩展、多主机管理工具——Agent 基础设施和协议层开始出现
  5. AI 工具定价模式探索:从按 token 计费到订阅模式,社区在探索更可持续的 AI 工具商业模式
  6. 反 AI 声音持续存在:”我不再使用 AI”、开源项目暗藏反 AI 指令、高中生学编程价值讨论——社区对 AI 的反思和抵制仍在持续
  7. AI 审查与隐私成为新战场:韩国 AI 图片审查法规和 Meta 鼠标追踪争议,AI 监管话题升温

🎓 Reddit r/MachineLearning

📅 月榜 Top 15

# Flair 标题 分数 💬 作者
1 新闻 arXiv 对含有明确未经检查的 LLM 生成错误(如幻觉引用或结果)的论文实施 1 年禁令 703 85 Nunki08
2 讨论 对 arXiv 提议的 1 年禁令的强烈反对令人费解 584 165 NeighborhoodFatCat
3 研究 Hugging Face 复活 PapersWithCode 380 39 NielsRogge
4 讨论 项目误导高中生付费参与 ML 研究学术不端行为 264 38 Marisu_BG
5 研究 AI 生成的 CUDA 内核静默破坏训练和推理 265 30 laginimaineb
6 讨论 低质量内容让我感到与 AI 研究脱节 239 84 Skye7821
7 讨论 ML 博士生,你们平均每天工作多少小时? 161 71 akardashian
8 项目 PapersWithCode 新功能 - 第一周 153 9 NielsRogge
9 讨论 复杂性理论并未证明 ML 无法达到人类水平表现 151 53 mike_uoftdcs
10 项目 新数据集:超过 1 亿张高质量精选图像,含标题和元数据 130 29 dh7net
11 讨论 被一位咄咄逼人的”独立研究者”骚扰,要求在我的论文中使用特定引用和措辞 123 67 snekslayer
12 讨论 OpenAI 声称通用推理模型找到了 Erdős 单位距离界限的反例 119 39 NutInBobby
13 讨论 我在华为温哥华面试 ML 研究岗的经历:宣传与评估方式严重不匹配 119 18 Adventurous-Cut-7077
14 研究 对持续学习研究感兴趣的人 115 40 Evening-Living-9822
15 讨论 你们去哪里进行严肃的 AI 研究讨论? 106 60 Possible-Active-1903

💬 热门帖子评论摘要

帖子:arXiv 对含有明确未经检查的 LLM 生成错误(如幻觉引用或结果)的论文实施 1 年禁令

  • 支持这个决定 (👍 260)
  • 说实话,我现在支持对所有共同作者实施 3-5 年禁令。目前的情况几乎是对科学社区的 DDoS 攻击… (👍 227)
  • 我认为未经检查的 LLM 使用等同于伪造数据,因为它很可能生成从未发生过的幻觉结果,这会消除对整篇论文的信任。在传统期刊中,这会让你作为第一作者被终身禁止从事科学研究… (👍 69)

帖子:对 arXiv 提议的 1 年禁令的强烈反对令人费解

  • 反对的人显然就是那些提交低质量内容的人… (👍 471)
  • 很难相信有人会反对这个。这不应该成为争议话题 (👍 312)
  • 不可思议。我的导师会逐行审阅论文。我有时会放入愚蠢的笑话作为标记,每次他都会用红笔划掉。无法想象成为一名教授却连自己署名的东西都不审阅所需的懒惰程度… (👍 114)
  • 我最大的担忧是 arXiv 是否验证每位作者确实签署了论文… (👍 45)

帖子:Hugging Face 复活 PapersWithCode

  • 当我还是研究生时,这个网站是我了解模型/数据集/方法论最新趋势的首选。很高兴它回来了。谢谢 (👍 99)
  • 感谢你们做上帝的工作,我也是这个网站的粉丝。我是学术界的,如果需要帮忙请告诉我 (👍 43)
  • PapersWithCode 最重要的功能是「实现」列表,可以看到实现特定论文的所有 GitHub 仓库 (👍 27)
  • 这类网站的主要问题是任务和基准测试有大量重复,有些任务过于特定以至于只有一篇论文讨论 (👍 9)
  • 功能请求:标记分类错误的论文。AI agent 做得不错,但会犯错,比如将 Test-Time Scaling 论文分类为 Text-To-Speech (👍 6)

帖子:项目误导高中生付费参与 ML 研究学术不端行为

  • 我几年前在南湾一所理工科强校就读。当时很多同学为了提升大学申请会申请竞争激烈的暑期研究项目(当然要花钱),在实验室工作获得研究经验… (👍 89)
  • 看起来有人甚至写了关于这个的文章。这确实说明了现在 ML 研究的「严谨性」,考虑到他们的 113 篇论文中有 89 篇被 NeurIPS 接收… (👍 51)
  • 这确实看起来非常可疑。我只是想知道你是如何检查这些错误的 (👍 18)
  • 最荒谬的是这个人没有博士甚至硕士学位。而且他在开始这个之前几乎没有足够的研究经验来胜任… (👍 14)

帖子:AI 生成的 CUDA 内核静默破坏训练和推理

  • 原来实际的 bug 是嵌入梯度部分的内核在 bf16 而非 fp32 中累加。很多人永远找不到这种问题。有些人可能会看到但忽略它,因为 bf16 使用太频繁了 (👍 93)
  • 所以解决方案是用 AdamW… (👍 36)
  • 没有什么比花 3 天调试模型最后发现内核从一开始就有问题更能磨练性格的了 (👍 20)

🎯 核心洞察

Flair 分类统计:

  • 讨论: 9 篇
  • 研究: 3 篇
  • 项目: 2 篇
  • 新闻: 1 篇

社区趋势观察:

  • 本月最大热点:arXiv 对 LLM 生成内容的论文实施禁令引发激烈讨论,社区对学术诚信高度关注
  • Hugging Face 复活 PapersWithCode 项目,受到社区广泛欢迎
  • AI 生成代码(CUDA 内核)的可靠性引发担忧,暴露自动化代码生成的隐患
  • ML 博士生工作压力和学术生态讨论持续热门
  • Discussion 类帖子占主导(9/15),显示社区高度关注学术规范和职业发展话题

🎓 Reddit r/MachineLearning(周榜)

📅 周榜 Top 15

# Flair 标题 分数 💬 作者
1 讨论 NeurIPS 使用未校准的 AI 检测器进行桌面拒稿 101 62 Asleep-Requirement13
2 研究 世界模型目前的研究重点是什么? 76 23 nat-abhishek
3 研究 On-policy 蒸馏:PapersWithCode 上最热门的术语之一 70 14 NielsRogge
4 项目 在 PapersWithCode 上浏览 CVPR 2026 论文 68 18 NielsRogge
5 新闻 MiniMax 发布了新的注意力架构 58 10 superintelligence03
6 讨论 没有 PhD 实习就毕业 54 38 NumberGenerator
7 讨论 为什么 Word2Vec 的输出层权重会变成词向量? 27 12 aaryantiwari26
8 讨论 你如何识别优秀的研究者? 27 22 roguejedi1
9 研究 UAI 结果已公布 25 89 GeeseChen
10 研究 KVarN:方差归一化 KV-Cache 量化 21 8 intentionallyBlue
11 讨论 首篇论文被接收(ICML Workshop),我应该参加吗? 16 10 YukiOnnaLake
12 讨论 AlphaZero 训练数据分析 14 1 YamEnvironmental4720
13 讨论 为什么我们 LightGBM 最重要的特征反而让预测变差 7 11 Nj-yeti
14 讨论 用监督学习还是强化学习微调推理 LLM? 9 6 zdeneklapes
15 讨论 ICML openreviews 什么时候公开? 8 13 camelCasedUser

🎯 核心洞察(周榜)

Flair 分类统计:

  • 讨论: 9 篇
  • 研究: 4 篇
  • 项目: 1 篇
  • 新闻: 1 篇

本周社区趋势:

  • 本周最大争议:NeurIPS 使用未校准的 AI 检测器进行桌面拒稿,引发学术公正性质疑
  • MiniMax 发布新注意力架构,引起技术社区关注
  • CVPR 2026 论文已在 PapersWithCode 上线,社区可浏览最新研究
  • 世界模型(World Models)研究方向引发讨论,持续是热门话题
  • KV-Cache 量化等推理优化技术持续受关注
  • Discussion 占 9/15,社区关注职业发展、研究方法论和会议动态

🚀 Product Hunt

📅 月榜 Top 17(2026 年 6 月)

# 产品 👍 💬 标签 说明
1 Fundraisly 267 1,086 风险投资 · 人工智能 · 融资 AI 融资代理,自动寻找投资人并预约会议
2 Elentaria 96 529 销售 · 营销 从诊断到执行的一站式 GTM(市场进入)解决方案
3 Mailwarm 2.0 103 566 邮件 · 邮件营销 邮件预热工具升级版,提升邮件送达率
4 InsForge Backend Branching 184 530 开源 · 开发者工具 · GitHub 后端的 Git 风格分支管理系统
5 Mina Meeting Assistant 134 467 效率 · 人工智能 · 无代码 AI 会议助手,通话中实时响应和执行任务
6 Vokal 50 451 效率 · 消息 · 人工智能 面向 10x 团队和 AI 代理的协作空间
7 superlog 79 442 开源 · 软件工程 · 开发者工具 让你的产品告别 Bug
8 SocialEcho 2.0 132 388 社交媒体 · 营销 · SaaS AI 社交媒体副驾驶,面向团队和智能代理
9 Astra Autonomous Pentest 55 398 SaaS · 开发者工具 · 安全 AI 代理自动发现、验证和修复安全漏洞
10 Databox MCP 59 360 效率 · 数据分析 · 人工智能 在 Claude、ChatGPT 等工具中与业务数据对话
11 Dune Keypad 55 357 效率 · 开发者工具 · 人工智能 上下文感知 Mac 键盘,支持 Claude 和社区扩展
12 Gigacatalyst 39 293 销售 · SaaS · 人工智能 赋予销售和客户成功团队工程超能力
13 Empromptu AI 113 321 开发者工具 · 人工智能 · 无代码 用已有 AI 应用训练微调模型
14 folk 70 303 效率 · 消息 · 人工智能 短信中的 AI 助手,帮你搞定事务
15 Typeahead 47 296 效率 · 写作 · 人工智能 Mac 上所有应用的 AI 自动补全
16 Co-Invest 37 276 金融科技 · 投资 · 金融 直接在 ChatGPT 和 Claude 中交易 500+ 市场
17 Google Gemma 4 12B 7 286 开源 · 开发者工具 · GitHub 无编码器架构的本地多模态 AI 模型

📅 周榜 Top 17(2026-W23,6 月 1—7 日)

# 产品 👍 💬 标签 说明
1 Fundraisly 267 1,086 风险投资 · 人工智能 · 融资 AI 融资代理,自动寻找投资人并预约会议
2 Mailwarm 2.0 103 566 邮件 · 邮件营销 邮件预热工具升级版,提升邮件送达率
3 InsForge Backend Branching 184 530 开源 · 开发者工具 · GitHub 后端的 Git 风格分支管理系统
4 Elentaria 96 529 销售 · 营销 从诊断到执行的一站式 GTM(市场进入)解决方案
5 Mina Meeting Assistant 134 467 效率 · 人工智能 · 无代码 AI 会议助手,通话中实时响应和执行任务
6 Vokal 50 451 效率 · 消息 · 人工智能 面向 10x 团队和 AI 代理的协作空间
7 superlog 79 442 开源 · 软件工程 · 开发者工具 让你的产品告别 Bug
8 SellerClaw 133 400 SaaS · 电商 AI 代理团队帮你跨渠道管理店铺
9 Astra Autonomous Pentest 55 398 SaaS · 开发者工具 · 安全 AI 代理自动发现、验证和修复安全漏洞
10 SocialEcho 2.0 132 388 社交媒体 · 营销 · SaaS AI 社交媒体副驾驶,面向团队和智能代理
11 Databox MCP 59 360 效率 · 数据分析 · 人工智能 在 Claude、ChatGPT 等工具中与业务数据对话
12 Dune Keypad 55 357 效率 · 开发者工具 · 人工智能 上下文感知 Mac 键盘,支持 Claude 和社区扩展
13 Minimi 57 347 效率 · 人工智能 · 科技 你的 Claude 环境记忆工具
14 Leni 54 336 投资 · 人工智能 · 数据分析 全球最精准的投资人 AI
15 Empromptu AI 113 321 开发者工具 · 人工智能 · 无代码 用已有 AI 应用训练微调模型
16 folk 70 303 效率 · 消息 · 人工智能 短信中的 AI 助手,帮你搞定事务
17 Typeahead 47 296 效率 · 写作 · 人工智能 Mac 上所有应用的 AI 自动补全

🎯 独家发现

闭源 SaaS 新品(其他源难以获取)

  • Fundraisly:AI 融资代理 SaaS,267 票/1086 评论高居榜首,体现 AI + 金融的强劲需求
  • Elentaria:GTM(市场进入)诊断与执行平台,销售营销领域的 AI 工具
  • Mailwarm 2.0:邮件预热 SaaS 升级版,专注邮件送达率优化
  • SellerClaw:AI 代理驱动的多渠道电商管理平台(周榜独有)
  • Gigacatalyst:面向销售和客户团队的 AI 工程赋能工具

AI 产品热度排名

  1. 🥇 Fundraisly(AI 融资)— 1,086 💬,月/周双榜冠军
  2. 🥈 InsForge Backend Branching(开源开发工具)— 530 💬
  3. 🥉 Mailwarm 2.0(邮件 AI)— 566 💬
  4. Mina Meeting Assistant(AI 会议)— 467 💬
  5. Vokal(AI 协作)— 451 💬
  6. superlog(AI 调试)— 442 💬

周榜 vs 月榜差异产品

  • 周榜独有:SellerClaw(电商 AI)、Minimi(Claude 记忆工具)、Leni(投资 AI)
  • 月榜独有:Gigacatalyst(销售赋能)、Co-Invest(金融交易)、Google Gemma 4 12B(开源模型)

趋势洞察

  • AI Agent 产品持续霸榜,Top 17 中约 13 款产品涉及 AI
  • MCP 协议生态产品涌现(Databox MCP、Dune Keypad 支持 Claude)
  • 开发者工具赛道热度不减(InsForge、superlog、Empromptu AI)
  • 金融/投资领域 AI 化趋势明显(Fundraisly、Co-Invest、Leni)

📰 Techmeme AI 行业新闻

过去 7 天 AI 相关行业新闻精选(来源:TechCrunch / The Verge / Bloomberg / Reuters / NYT / WSJ 等)

📅 本周 AI 新闻 Top 15

# 标题 来源 说明
1 Anthropic 向 SEC 机密提交 S-1 招股书草案 Anthropic Anthropic 正式提交 IPO 招股书草案,计划最早今年秋季上市,与 OpenAI、SpaceX 一起成为 2026 年最受关注的上市项目
2 Anthropic 确认已机密提交 IPO 申请 纽约时报 多家媒体同时报道,Anthropic 加入 OpenAI 和 SpaceX 的 2026 上市潮,三家合计可能为美股增加约 $4T 市值
3 ChatGPT 成为最快达到 10 亿全球月活用户的应用 路透社 Sensor Tower 数据显示 ChatGPT MAU 同比增长 62%,Claude MAU 同比增长 640% 至 5600 万,AI 应用用户增长惊人
4 Meta 推出 Meta Business Agent 商业 AI 代理 TechCrunch Meta 在 WhatsApp、Instagram 和 Messenger 上推出商业 AI 代理,可自动回答客户问题、完成销售和预约,全面布局商业 AI
5 微软与 OpenAI 分道扬镳,准备正面对决 The Verge 微软 AI CEO Mustafa Suleyman 表示微软目标是成为”全球前四 AI 实验室”,与 OpenAI 重新谈判合同是关键转折点
6 Anthropic 公布递归自我改进进展 Anthropic Anthropic 披露其代码库中 80%+ 的代码由 Claude 编写,AI 自我改进能力取得重大突破
7 Anthropic 推出 Claude 合作伙伴网络服务层级 华尔街日报 Anthropic 推出 Claude Partner Network 服务等级体系,根据企业使用 Claude 构建的产品进行排名,并发布 Partner Hub 门户
8 中国 AI 开发商 MiniMax 发布 M3 编程模型 The Information MiniMax 发布 M3 编程模型,号称媲美 Claude Opus 4.7,输入 token 价格仅 $0.12/百万(对比 Opus 4.7 的 $5),中国 AI 模型竞争白热化
9 Google 发布 Gemma 4 12B 开源模型 Google DeepMind Gemma 4 12B 发布,统一架构移除独立多模态编码器,支持本地视觉和音频理解及高级推理,可在 8-16GB VRAM 设备运行
10 Salesforce 持有 Anthropic 约 50 亿美元股份 彭博社 Salesforce 自 2023 年初起持续投资 Anthropic,持股价值已增至约 $5B,大厂通过投资深度绑定 AI 初创
11 机器人初创 Generalist 融资 4 亿美元 Bloomberg 机器人公司 Generalist 发布 GEN-1 模型可完成短距物理任务,获 Radical Ventures 领投 $400M,估值 $2B
12 白宫与 Anthropic 争端缓和 路透社 消息人士称白宫与 Anthropic 长达数月的分歧正出现缓解迹象,为 IPO 扫清政治障碍
13 剑桥大学开发首个 AI 设计关键成分的疫苗 BBC 剑桥大学研究人员开发了首个关键成分完全由 AI 设计的疫苗,并已在人体中进行试验,AI 在药物研发领域的里程碑
14 Google 要求 Play 开发者出售代码库访问权用于 AI 训练 404 Media 邮件曝光 Google 邀请 Google Play 开发者参加”机密内容试点”,付费获取代码库访问权以训练 AI 编程工具
15 SpaceX 获 550 亿美元芯片工厂财产税豁免 金融时报 SpaceX 在德州计划中的 $55B Terafab 芯片工厂获得财产税豁免,尽管面临当地居民反对和法律威胁

🎯 行业核心动态

大公司动向(产品发布、收购、融资)

  • Anthropic IPO 加速:机密提交 S-1,估值有望成为 2026 年最大科技 IPO 之一;同期推出合作伙伴生态体系,代码库 80%+ 由 Claude 自行编写
  • Microsoft 正式”单飞”:与 OpenAI 重新谈判合同后,微软 AI CEO 明确表态要成为全球前四 AI 实验室,不再依赖 GPT
  • Meta 全面商业化 AI:推出 Meta Business Agent,覆盖 WhatsApp/Instagram/Messenger 三大平台,从社交走向商业智能
  • Google 开源 Gemma 4:12B 参数模型支持本地多模态推理,降低 AI 部署门槛,与开源社区深度绑定

政策法规(AI 监管、版权诉讼)

  • 白宫与 Anthropic 的监管分歧出现缓和迹象,为 Anthropic IPO 扫清政治障碍
  • Google 被曝付费获取 Play 开发者代码库用于 AI 训练,数据合规边界再次引发关注
  • 伊利诺伊州州长计划暂停数据中心税收优惠,要求建立开发框架

商业化进展

  • ChatGPT 成为史上最快达到 10 亿月活的应用,Claude MAU 增速更达 640%
  • 中国 AI 模型价格战激烈:MiniMax M3 以 Opus 4.7 约 1/40 的价格提供可比性能
  • Salesforce 持有 Anthropic 股份价值飙升至 $5B,大厂通过投资锁定 AI 生态位
  • SpaceX/Anthropic/OpenAI 三家 IPO 合计可能为美股增加约 $4T 市值

📈 Trendshift — GitHub 项目社交热度

数据来源:trendshift.io | 采集时间:2026-06-06 05:46 UTC+8

📅 日榜 Top 10(今日爆发)

# 项目 📈 今日增长 提及 说明 主题
1 pewdiepie-archdaemon/odysseus 1.2k 176 自托管 AI 工作空间 AI Agent, 自托管
2 chopratejas/headroom 553 27 LLM 应用上下文优化层 AI Agent, AI 基础设施
3 anthropics/defending-code-reference-harness 494 38 AI 安全扫描工具(威胁建模+自主扫描 Harness) AI Agent
4 alibaba/open-code-review 449 13 阿里巴巴混合架构 AI 代码审查(规则引擎+LLM Agent) AI Agent, AI 编码助手
5 nexu-io/html-video 412 46 面向编码 Agent 的 HTML→视频元层 AI Agent, AI 视频生成, 无头浏览器
6 colbymchenry/codegraph 452 26 Claude Code 预索引代码知识图谱(本地运行) AI 编码助手
7 BigPizzaV3/CodexPlusPlus 322 23 CodexApp 增强工具,让 Codex 更好用 AI 编码助手
8 farion1231/cc-switch 300 26 跨平台 AI 编码助手桌面客户端(支持 Claude Code/Codex/OpenCode/OpenClaw 等) AI 编码助手, MCP
9 obra/superpowers 256 29 Agent 技能框架与软件开发方法论 AI Agent, AI 编码助手, AI 技能
10 PaddlePaddle/PaddleOCR 244 14 百度 OCR 工具集,支持 100+ 语言,打通 PDF/图像与 LLM 计算机视觉, NLP, 文档处理

📊 日榜主题热度分布

排名 主题 总星标
1 AI Agent 13.4k
2 AI 编码助手 5.4k
3 AI 技能 4.3k
4 自托管 3.6k
5 AI 工作流 1.9k
6 AI 基础设施 1.6k
7 AI 视频生成 1.2k
8 MCP 1.1k
9 NLP 1.1k
10 RAG 1k

🔥 值得关注

  • anthropics/defending-code-reference-harness — Anthropic 官方出品,AI Agent 安全领域新工具
  • alibaba/open-code-review — 阿里巴巴开源混合架构代码审查,内置细粒度规则集(NPE、线程安全、XSS、SQL 注入)
  • PaddlePaddle/PaddleOCR — 老牌项目持续活跃,OCR 作为 AI 数据管道关键组件热度不减

📈 Trendshift — GitHub 项目社交热度(周榜)

数据来源:trendshift.io/weekly | 采集时间:2026-06-06 05:46 UTC+8

📅 周榜 Top 10(持续热度)

# 项目 📈 周增长 提及 说明 主题
1 pewdiepie-archdaemon/odysseus 39k 4.3k 自托管 AI 工作空间 AI Agent, 自托管
2 chopratejas/headroom 8.1k 464 LLM 应用上下文优化层 AI Agent, AI 基础设施
3 microsoft/markitdown 8.7k 597 文件/Office 文档转 Markdown(AI 数据准备) 文档处理
4 nesquena/hermes-webui 3.4k 252 Hermes Agent Web/手机界面 AI Agent, 自托管
5 affaan-m/ECC 6.1k 957 Agent 性能优化系统(技能+本能+记忆+安全) AI Agent, AI 编码助手, AI 技能
6 NousResearch/hermes-agent 5.5k 1.3k 可成长的 AI Agent(由 NousResearch 出品) AI Agent, AI 技能
7 supermemoryai/supermemory 2.1k 124 AI 时代的高速可扩展记忆引擎 AI Agent, AI 记忆, RAG
8 farion1231/cc-switch 4.8k 340 跨平台 AI 编码助手桌面客户端(支持 Claude Code/Codex/OpenCode/OpenClaw 等) AI 编码助手, MCP
9 harry0703/MoneyPrinterTurbo 5.2k 693 AI 大模型一键生成高清短视频 AI 视频生成
10 colbymchenry/codegraph 5k 319 Claude Code 预索引代码知识图谱(本地运行) AI 编码助手

🎯 核心洞察

以下项目在社交媒体上爆发式传播,但可能不会出现在 GitHub Trending 上:

  • pewdiepie-archdaemon/odysseus — 日榜/周榜双冠王,周增 39k,社交媒体传播极强。自托管 AI 工作空间,社区讨论远超 star 增速
  • farion1231/cc-switch — AI 编码助手桌面客户端(支持 Claude Code/Codex/OpenCode/OpenClaw 等),社交热度远超 GitHub star
  • affaan-m/ECC — Agent 性能优化系统,957 周提及量排名第二,Twitter/X 讨论火爆
  • MadsLorentzen/ai-job-search — AI 驱动求职框架(日榜 #22),40 提及 / 145 增长 = 27.6% 提及率,社交媒体传播效率极高
  • asz798838958/aBaiAutoplus — 多平台 AI 账号自动注册与管理,中文社区热点项目(周榜 #18,606 提及)

📣 社交媒体传播最快的项目

按「提及数 / 增长数」比率排序(比率越高 = 社交传播越强):

项目 增长 提及 提及率 说明
NousResearch/hermes-agent 5.5k 1.3k 23.6% 可成长 Agent,社区讨论热烈
affaan-m/ECC 6.1k 957 15.7% Agent 性能优化系统
harry0703/MoneyPrinterTurbo 5.2k 693 13.3% AI 短视频生成
nexu-io/html-video 412 46 11.2% HTML→视频 Agent 工具(日榜)
pewdiepie-archdaemon/odysseus 39k 4.3k 11.0% 自托管 AI 工作空间

📌 趋势总结

  1. AI Agent 框架持续爆发:odysseus、hermes-agent、ECC 等多个 Agent 框架同时上榜,Agent 生态进入百花齐放阶段
  2. AI 编码助手工具链成熟:cc-switch(桌面客户端)、codegraph(知识图谱)、CodexPlusPlus(增强工具)形成完整工具链
  3. 自托管需求强劲:odysseus、hermes-webui、open-notebook 等自托管项目上榜,用户对数据隐私和自主可控需求上升
  4. AI 记忆/上下文优化成为新热点:headroom(上下文优化)、supermemory(记忆引擎)等关注 Agent 长期记忆能力
  5. 中国 AI 开源项目活跃:PaddleOCR(百度)、open-code-review(阿里)、MoneyPrinterTurbo、aBaiAutoplus 等多个中文项目上榜