AI 趋势周报:2026-W21
🤖 AI 趋势周报 · 2026-W21 (05-18 - 05-24)
📊 GitHub Trending
月榜 Top 20
数据采集时间:2026-05-24 | 来源:github.com/trending?since=monthly
| # | 项目 | 语言 | ⭐ 总计 | 📈 本月新增 | 说明 |
|---|---|---|---|---|---|
| 1 | multica-ai/andrej-karpathy-skills | - | 150,426 | 70,773 | 基于 Andrej Karpathy 观察的 Claude Code 行为优化 CLAUDE.md 文件 |
| 2 | mattpocock/skills | Shell | 102,787 | 85,195 | 实用工程师技能集合,直接来自作者的 .claude 目录 |
| 3 | TauricResearch/TradingAgents | Python | 79,045 | 26,704 | 多智能体 LLM 金融交易框架 |
| 4 | Z4nzu/hackingtool | Python | 76,372 | 16,237 | 一站式黑客工具集 |
| 5 | ruvnet/ruflo | TypeScript | 54,573 | 21,850 | Claude 多智能体编排平台,支持群体智能和 RAG 集成 |
| 6 | addyosmani/agent-skills | Shell | 45,235 | 23,686 | 生产级 AI 编程智能体技能集 |
| 7 | bytedance/UI-TARS-desktop | TypeScript | 35,081 | 5,666 | 字节跳动开源多模态 AI 智能体栈 |
| 8 | soxoj/maigret | Python | 30,107 | 10,535 | 通过用户名从 3000+ 网站收集个人信息档案 |
| 9 | Alishahryar1/free-claude-code | Python | 28,750 | 24,512 | 免费使用 Claude Code 的终端/VSCode/Discord 方案 |
| 10 | anthropics/financial-services | Python | 27,141 | 19,289 | Anthropic 官方金融服务行业 AI 解决方案 |
| 11 | colbymchenry/codegraph | TypeScript | 20,516 | 17,463 | 预索引代码知识图谱,减少 AI 编程工具的 token 消耗 |
| 12 | Imbad0202/academic-research-skills | Python | 20,037 | 16,073 | Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿 |
| 13 | CloakHQ/CloakBrowser | Python | 19,836 | 17,847 | 隐身 Chromium 浏览器,通过所有机器人检测测试 |
| 14 | AIDC-AI/Pixelle-Video | Python | 19,431 | 13,218 | AI 全自动短视频引擎 |
| 15 | rohitg00/agentmemory | TypeScript | 17,022 | 14,753 | AI 编程智能体的持久化记忆方案,基准测试排名第一 |
| 16 | decolua/9router | JavaScript | 13,871 | 10,813 | 免费无限 AI 编程路由,连接 40+ 提供商 |
| 17 | refactoringhq/tolaria | TypeScript | 11,408 | 10,527 | Markdown 知识库管理桌面应用 |
| 18 | ComposioHQ/awesome-codex-skills | Python | 11,336 | 10,326 | Codex CLI/API 实用技能精选列表 |
| 19 | HKUDS/ViMax | Python | 7,135 | 4,152 | 智能体式视频生成,集成导演、编剧、制片人功能 |
| 20 | mattpocock/sandcastle | TypeScript | 4,898 | 3,929 | TypeScript 沙箱化编程智能体编排框架 |
月榜核心洞察
AI 编程智能体技能成为绝对主流:月榜 Top 20 中,超过 80% 的项目直接与 AI 编程智能体(Claude Code、Codex、Cursor)相关。
mattpocock/skills(本月 +85K)、multica-ai/andrej-karpathy-skills(本月 +70K)这类”技能配置”项目爆发式增长,说明 AI 辅助编程已从工具层面升级到”方法论”层面。Python 和 TypeScript 主导:Python(8 个)和 TypeScript/Shell/JavaScript(7 个)合计占比 75%。Python 主要集中在 AI/数据/安全领域,TypeScript/JavaScript 集中在智能体编排和开发者工具。
“免费 AI 编程”成新趋势:
Alishahryar1/free-claude-code(+24K)和decolua/9router(+10K)都是帮助用户免费使用 AI 编程工具的路由/代理项目,反映出开发者对 AI 编程工具的强烈需求和付费门槛的矛盾。中国力量崛起:
AIDC-AI/Pixelle-Video(阿里系,全自动短视频引擎)、HKUDS/ViMax(港大,智能体视频生成)等中国团队项目频繁上榜,AI 视频生成是中国团队的优势赛道。
周榜 Top 14
数据采集时间:2026-05-24 | 来源:github.com/trending?since=weekly
| # | 项目 | 语言 | ⭐ 总计 | 📈 本周新增 | 说明 |
|---|---|---|---|---|---|
| 1 | obra/superpowers | Shell | 204,305 | 10,367 | 智能体技能框架与软件开发方法论 |
| 2 | ruvnet/RuView | Rust | 64,959 | 6,741 | 利用 WiFi 信号实现实时空间智能和生命体征监测,无需摄像头 |
| 3 | tinyhumansai/openhuman | Rust | 26,641 | 16,288 | 个人 AI 超级智能助手,私有、简单、极其强大 |
| 4 | K-Dense-AI/scientific-agent-skills | Python | 25,461 | 2,522 | 面向研究、科学、工程、分析、金融和写作的智能体技能集 |
| 5 | Lum1104/Understand-Anything | TypeScript | 22,946 | 4,880 | 将任意代码转为可交互知识图谱,支持多种 AI 编程工具 |
| 6 | humanlayer/12-factor-agents | TypeScript | 22,033 | 2,035 | 构建 LLM 驱动软件的 12 个最佳实践原则 |
| 7 | colbymchenry/codegraph | TypeScript | 20,517 | 15,909 | 预索引代码知识图谱,减少 AI 编程工具的 token 消耗 |
| 8 | CloakHQ/CloakBrowser | Python | 19,836 | 6,991 | 隐身 Chromium 浏览器,通过所有机器人检测测试 |
| 9 | rohitg00/agentmemory | TypeScript | 17,024 | 6,734 | AI 编程智能体的持久化记忆方案 |
| 10 | rohitg00/ai-engineering-from-scratch | Python | 14,276 | 5,026 | 从零开始学习 AI 工程的实战教程 |
| 11 | datawhalechina/easy-vibe | JavaScript | 14,355 | 2,711 | Datawhale 出品的 Vibe Coding 入门课程 |
| 12 | Imbad0202/academic-research-skills | Python | 20,040 | 11,691 | Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿 |
| 13 | supertone-inc/supertonic | Swift | 9,936 | 3,281 | 极速端上多语言 TTS 引擎,基于 ONNX 本地运行 |
| 14 | HKUDS/ViMax | Python | 7,135 | 2,790 | 智能体式视频生成,集成导演、编剧、制片人功能 |
周榜核心洞察
周榜新爆发现象明显:tinyhumansai/openhuman(Rust,本周 +16K)和 colbymchenry/codegraph(TypeScript,本周 +15K)是本周最强爆发项目,分别代表了”个人 AI 助手”和”代码理解图谱”两个方向。ruvnet/RuView(Rust,本周 +6.7K)利用 WiFi 信号做空间感知,技术路线新颖。
Rust 语言异军突起:周榜中 Rust 项目有 2 个(
openhuman、RuView),这是月榜中完全没有出现的语言。高性能、隐私优先的本地 AI 工具正在选择 Rust 作为实现语言。AI 相关项目占比约 85%:14 个项目中约 12 个直接与 AI 相关(智能体技能、AI 编程工具、TTS、视频生成等),AI 已完全主导 GitHub 热门趋势。
🔍 OSSInsight
月榜 Top 30(按类别)
数据来源:OSSInsight Trending (This Month) | 采集时间:2026-05-24
🤖 AI Coding Agent(编程工具、IDE 插件、代码生成)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | mattpocock/skills | 8,928 | 788 | Shell | 真正工程师的 Claude Code 技能集,直接来自 .claude 目录 |
| 2 | forrestchang/andrej-karpathy-skills | 8,304 | 908 | - | 基于 Karpathy 对 LLM 编程陷阱观察的 CLAUDE.md 改进文件 |
| 4 | obra/superpowers | 3,957 | 403 | Shell | Agent 技能框架与软件开发方法论 |
| 5 | Hmbown/DeepSeek-TUI | 3,332 | 267 | Rust | DeepSeek 模型的终端编程代理 |
| 7 | affaan-m/ECC | 2,873 | 463 | JavaScript | Agent 性能优化系统,含技能、本能、记忆、安全和研究驱动开发 |
| 8 | farion1231/cc-switch | 3,070 | 233 | Rust | Claude Code / Codex / Gemini CLI 等跨平台桌面一体化助手工具 |
| 9 | warpdotdev/warp | 3,193 | 399 | - | 基于终端的 Agentic 开发环境 |
| 11 | ruvnet/ruflo | 2,674 | 324 | TypeScript | Claude 领先的 Agent 编排平台,支持多 Agent 群智能 |
| 13 | colbymchenry/codegraph | 1,840 | 95 | TypeScript | 为 Claude Code 预索引的代码知识图谱,减少 Token 消耗 |
| 14 | addyosmani/agent-skills | 2,436 | 226 | Shell | 生产级 AI 编程 Agent 工程技能 |
| 15 | Lum1104/Understand-Anything | 1,856 | 165 | TypeScript | 将任何代码转化为可交互的知识图谱 |
| 18 | garrytan/gstack | 2,150 | 365 | TypeScript | Garry Tan 的 Claude Code 配置,包含 23 个工具角色 |
| 20 | safishamsi/graphify | 2,166 | 228 | Python | 将代码文件夹转化为可查询的知识图谱技能 |
| 23 | anomalyco/opencode | 1,815 | 312 | TypeScript | 开源编程 Agent |
| 24 | anthropics/skills | 1,718 | 235 | Python | Anthropic 官方 Agent Skills 仓库 |
| 27 | JuliusBrussee/caveman | 1,900 | 144 | Python | Claude Code 技能,用”原始人语言”削减 65% Token |
🧠 AI Agent 框架(Agent 编排、工作流、基础设施)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 3 | NousResearch/hermes-agent | 5,620 | 1,203 | Python | 与你一同成长的 Agent 框架 |
| 10 | tinyhumansai/openhuman | 2,059 | 192 | Rust | 个人 AI 超级智能体,私有、简单、极其强大 |
| 19 | msitarzewski/agency-agents | 2,017 | 367 | Shell | 完整的 AI Agency,从前端到社区运营的专精 Agent 集合 |
| 31 | rohitg00/agentmemory | 1,356 | 114 | TypeScript | 基于真实基准测试的 AI 编程 Agent 持久记忆方案 |
🗣️ AI 语音/多模态(TTS、视频生成、图像生成)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 30 | HKUDS/ViMax | 238 | 31 | Python | Agentic 视频生成(导演、编剧、制片人、视频生成器一体化) |
🤗 AI 研究与数据(基础模型、数据集、研究论文)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 12 | Alishahryar1/free-claude-code | 3,029 | 413 | Python | 免费使用 Claude Code(终端/VSCode/Discord,支持语音) |
| 16 | anthropics/financial-services | 1,940 | 305 | Python | Anthropic 金融服务领域 Agent Skills |
| 26 | Imbad0202/academic-research-skills | 1,405 | 118 | Python | Claude Code 学术研究技能:研究→撰写→评审→修订→定稿 |
| 29 | github/spec-kit | 1,499 | 145 | Python | GitHub 官方规格驱动开发工具包 |
🛠️ 非 AI 热门(数据库、DevOps、前端等)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 6 | TauricResearch/TradingAgents | 3,291 | 714 | Python | 多 Agent LLM 金融交易框架 |
| 17 | VoltAgent/awesome-design-md | 2,182 | 241 | - | 品牌设计系统 DESIGN.md 集合,让编程 Agent 生成匹配 UI |
| 21 | CloakHQ/CloakBrowser | 1,704 | 137 | Python | 隐身 Chromium,通过所有机器人检测测试的 Playwright 替代品 |
| 22 | rtk-ai/rtk | 2,026 | 138 | Rust | CLI 代理,减少 LLM Token 消耗 60-90% |
| 25 | D4Vinci/Scrapling | 1,789 | 208 | Python | 自适应 Web 爬虫框架,从单请求到大规模爬取 |
| 28 | ruvnet/RuView | 1,365 | 189 | Rust | 利用 WiFi 信号实现实时空间感知与生命体征监测 |
| 30 | Z4nzu/hackingtool | 2,065 | 218 | Python | 一体化黑客工具集 |
月榜核心洞察
- AI 项目绝对霸榜:Top 30 中超过 90% 的项目直接与 AI/LLM 相关,几乎全部围绕 Claude Code、Codex、Cursor 等 AI 编程工具生态展开。
- Claude Code 生态爆发:榜单被 Claude Code Skills/Plugins 占据,反映出 Anthropic Claude Code 平台已成为 AI 编程 Agent 的核心基础设施。
- Token 优化成为独立赛道:caveman(削减 65% Token)、rtk(减少 60-90% Token)、codegraph(减少 Token 调用)等多个项目专注解决 LLM Token 消耗问题。
周榜 Top 30(按类别)
数据来源:OSSInsight Trending (This Week) | 采集时间:2026-05-24
🤖 AI Coding Agent(编程工具、IDE 插件、代码生成)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 1 | colbymchenry/codegraph | 1,548 | 86 | TypeScript | 为 Claude Code 预索引的代码知识图谱,减少 Token 消耗 |
| 2 | forrestchang/andrej-karpathy-skills | 1,498 | 174 | - | 基于 Karpathy 对 LLM 编程陷阱观察的 CLAUDE.md 文件 |
| 3 | Lum1104/Understand-Anything | 1,079 | 89 | TypeScript | 将任何代码转化为可交互的知识图谱 |
| 4 | mattpocock/skills | 1,053 | 123 | Shell | 真正工程师的 Claude Code 技能集 |
| 6 | anthropics/claude-plugins-official | 727 | 37 | Python | Anthropic 官方管理的高质量 Claude Code 插件目录 |
| 7 | rohitg00/ai-engineering-from-scratch | 647 | 116 | Python | 从零学习 AI 工程:学它、建它、发布它 |
| 10 | rohitg00/agentmemory | 490 | 35 | TypeScript | 基于真实基准测试的 AI 编程 Agent 持久记忆方案 |
| 11 | safishamsi/graphify | 336 | 23 | Python | 将代码文件夹转化为可查询知识图谱的 AI 技能 |
| 12 | Alishahryar1/free-claude-code | 281 | 48 | Python | 免费使用 Claude Code(终端/VSCode/Discord) |
| 13 | tashfeenahmed/freellmapi | 265 | 38 | TypeScript | 聚合 ~14 个 AI 提供商免费额度密钥的 OpenAI 兼容代理 |
| 18 | Hmbown/DeepSeek-TUI | 265 | 23 | Rust | DeepSeek 模型的终端编程代理 |
| 20 | HKUDS/CLI-Anything | 288 | 21 | Python | 让所有软件成为 Agent-Native 的 CLI 工具 |
| 22 | mukul975/Anthropic-Cybersecurity-Skills | 192 | 14 | Python | 754 个结构化 AI Agent 网络安全技能,映射 5 大框架 |
| 23 | hugohe3/ppt-master | 223 | 25 | Python | AI 从任何文档生成原生可编辑 PPTX |
| 25 | deColua/9router | 240 | 26 | JavaScript | 免费无限 AI 编程,连接 Claude/GPT/Gemini 等 40+ 提供商 |
| 27 | can1357/oh-my-pi | 210 | 11 | TypeScript | 终端 AI 编程 Agent,支持哈希锚定编辑和 LSP |
| 28 | manaflow-ai/cmux | 193 | 10 | Swift | 基于 Ghostty 的 macOS 终端,专为 AI 编程 Agent 设计 |
🧠 AI Agent 框架(Agent 编排、工作流、基础设施)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 5 | tinyhumansai/openhuman | 1,003 | 113 | Rust | 个人 AI 超级智能体,私有、简单、极其强大 |
| 15 | multica-ai/multica | 267 | 23 | TypeScript | 开源托管 Agent 平台,将编程 Agent 变成真正的队友 |
| 17 | simplifaisoul/osiris | 223 | 38 | TypeScript | 开源全球情报平台,实时 OSINT 仪表盘,Palantir 替代品 |
🗣️ AI 语音/多模态(TTS、视频生成、图像生成)
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 26 | supertone-inc/supertonic | 238 | 19 | Swift | 闪电般快速的设备端多语言 TTS,通过 ONNX 原生运行 |
| 30 | HKUDS/ViMax | 238 | 31 | Python | Agentic 视频生成(导演、编剧、制片人一体化) |
🤗 AI 研究与数据
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 8 | Imbad0202/academic-research-skills | 742 | 48 | Python | Claude Code 学术研究技能:研究→撰写→评审→修订→定稿 |
| 19 | Yuan1z0825/nature-skills | 252 | 21 | Python | 符合 Nature 论文学术表达和科研绘图的 Skill |
| 29 | anthropics/financial-services | 232 | 40 | Python | Anthropic 金融服务领域 Agent Skills |
🛠️ 非 AI 热门
| # | 项目 | ⭐ Stars | Fork | 语言 | 说明 |
|---|---|---|---|---|---|
| 9 | CloakHQ/CloakBrowser | 530 | 39 | Python | 隐身 Chromium,通过所有机器人检测,Playwright 替代品 |
| 14 | rmyndharis/OpenWA | 337 | 58 | TypeScript | 免费开源自托管的 WhatsApp API 网关 |
| 16 | rtk-ai/rtk | 283 | 20 | Rust | CLI 代理,减少 LLM Token 消耗 60-90% |
| 21 | truelockmc/streambert | 261 | 23 | JavaScript | 跨平台 Electron 桌面应用,零广告追踪的影视动漫流媒体下载 |
| 24 | Fincept-Corporation/FinceptTerminal | 217 | 25 | Python | 现代金融应用,提供高级市场分析和投资研究工具 |
周榜核心洞察
- 知识图谱成为本周热点:codegraph (#1)、Understand-Anything (#3)、graphify (#11) 三个项目同时聚焦”代码知识图谱”方向,反映 AI 编程 Agent 对代码理解深度的迫切需求。
- 与 GitHub Trending 重叠度约 60-70%:核心重叠项目包括 mattpocock/skills、andrej-karpathy-skills、DeepSeek-TUI、openhuman 等。OSSInsight 的特色在于收录了更多”小而美”的 Skills 类项目。
🤗 Hugging Face Models
采集时间:2026-05-24 | 排序:Trending(月榜)
排行表 Top 20
| # | 模型 | 任务 | 参数量 | 下载量 | 推理 | 亮点 |
|---|---|---|---|---|---|---|
| 1 | bytedance-research/Lance | 多模态(Any-to-Any) | — | 1.47k | ❌ | 字节跳动多模态全能模型,支持任意到任意模态转换 |
| 2 | tencent/Hy-MT2-1.8B | 翻译 | 2B | 4.53k | ✅ | 腾讯翻译模型,轻量级多语言翻译 |
| 3 | Supertone/supertonic-3 | 文本转语音 | — | 43.1k | ❌ | 韩国 Supertone 语音合成模型,高质量 TTS |
| 4 | tencent/Hy-MT2-30B-A3B | 翻译 | 30B | 1.24k | ❌ | 腾讯大参数翻译模型,MoE 架构激活参数 3B |
| 5 | NemoStation/Marlin-2B | 视频转文本 | 2B | 6.03k | ❌ | 轻量视频理解模型,专注视频内容分析 |
| 6 | sapientinc/HRM-Text-1B | 文本生成 | 1B | 84.3k | ❌ | 极轻量文本生成模型,适合边缘部署 |
| 7 | openbmb/MiniCPM-V-4.6 | 图文理解 | — | 270k | ❌ | 面壁智能多模态模型 MiniCPM-V 最新版本 |
| 8 | SulphurAI/Sulphur-2-base | 文本转视频 | 9B | 1.33M | ❌ | 文本生成视频模型,下载量破百万 |
| 9 | unsloth/Qwen3.6-27B-MTP-GGUF | 图文理解 | 27B | 660k | ❌ | Qwen3.6-27B 的 GGUF 量化版,支持本地推理 |
| 10 | CohereLabs/command-a-plus-05-2026-w4a4 | 图文理解 | 126B | 5.63k | ✅ | Cohere 最新命令模型,4bit 量化版 |
| 11 | unsloth/Qwen3.6-35B-A3B-MTP-GGUF | 图文理解 | 36B | 548k | ❌ | Qwen3.6 MoE 模型 GGUF 量化版,高效推理 |
| 12 | circlestone-labs/Anima | — | — | 637k | ❌ | 高人气社区模型,下载量超 63 万 |
| 13 | Jackrong/Qwopus3.5-9B-Coder-GGUF | 图文理解 | 9B | 38.9k | ❌ | 基于 Qwen 的编程优化 GGUF 量化模型 |
| 14 | deepseek-ai/DeepSeek-V4-Pro | 文本生成 | 862B | 4.67M | ✅ | DeepSeek V4 旗舰模型,467 万下载量霸榜 |
| 15 | tencent/Hy-MT2-7B | 翻译 | 8B | 2.41k | ❌ | 腾讯中等规模翻译模型,平衡性能与效率 |
| 16 | ResembleAI/Dramabox | 文本转语音 | — | 1.45k | ❌ | ResembleAI 语音合成模型,面向创意内容 |
| 17 | CohereLabs/command-a-plus-05-2026-bf16 | 图文理解 | 219B | 12.4k | ✅ | Cohere 最大规模命令模型,bf16 精度全量版 |
| 18 | numind/NuExtract3 | 图像转文本 | 5B | 11k | ❌ | 文档信息提取专用模型,第三代 |
| 19 | Jackrong/Qwopus3.6-27B-v2-GGUF | 图文理解 | 27B | 8.3k | ❌ | Qwen3.6-27B 社区优化版 GGUF 量化 |
| 20 | TencentARC/Pixal3D | 图像转3D | — | — | ❌ | 腾讯 ARC 单图生成 3D 模型 |
核心洞察
- 国产模型强势崛起:Top 20 中中国团队贡献了 10 个模型(字节跳动、腾讯×4、面壁智能、DeepSeek×2、美团、腾讯 ARC),占据半壁江山。DeepSeek-V4-Pro 以 862B 参数、467 万下载量稳居榜首级别。
- GGUF 量化成主流部署方式:unsloth 的 Qwen3.6 GGUF 量化版占据多个席位,社区对本地可运行模型需求旺盛,Qwen3.6 系列成量化热门。
- 多模态与垂直领域并重:图文理解是最热门任务类型,同时翻译(腾讯 Hy-MT2 系列三款上榜)、语音合成(TTS)、视频生成等垂直领域均有突破。
- 轻量模型与超大模型两极化:从 1B 的 HRM-Text 到 862B 的 DeepSeek-V4-Pro,趋势呈现明显的两极分化——要么追求极致轻量可本地运行,要么追求极致性能靠云端推理。
📝 Hugging Face Papers
数据采集时间:2026-05-24 | 来源:huggingface.co/papers/month/2026-05
月榜 Top 20
| # | 论文标题 | 👍 | 方向 | 作者/机构 | GitHub ⭐ | 亮点 |
|---|---|---|---|---|---|---|
| 1 | MolmoAct2: Action Reasoning Models for Real-world Deployment(面向真实部署的动作推理模型) | 335 | 具身智能 / Agent | Ai2(艾伦人工智能研究所) | 530 | Ai2 推出面向真实世界部署的动作推理模型,结合视觉理解与操作执行 |
| 2 | CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence(可信文档智能的证据归因基准) | 263 | 文档理解 / NLP | OpenDataLab(上海人工智能实验室开放数据团队) | 66 | 首个面向文档智能证据归因的评测基准,推动可信 AI |
| 3 | Heterogeneous Scientific Foundation Model Collaboration(异构科学基础模型协作) | 218 | 科学计算 / 基础模型 | UIUC(伊利诺伊大学香槟分校) | 22 | 探索不同科学领域基础模型之间的异构协作范式 |
| 4 | MinT: Managed Infrastructure for Training and Serving Millions of LLMs(面向百万级 LLM 训练与推理的托管基础设施) | 217 | LLM 基础设施 | Mind Lab | 37 | 大规模 LLM 训练和服务的基础设施方案,支持百万级模型管理 |
| 5 | Mean Mode Screaming: Mean-Variance Split Residuals for 1000-Layer Diffusion Transformers(面向千层扩散 Transformer 的均值-方差分裂残差) | 215 | 扩散模型 / 架构创新 | StableKirito(独立研究者) | 9 | 突破性工作:成功训练 1000 层扩散 Transformer,残差连接新范式 |
| 6 | Code as Agent Harness(以代码驱动的 Agent 框架) | 199 | AI Agent / 代码智能 | 42 人团队 | 214 | 将代码作为 Agent 核心驱动力的全新框架设计 |
| 7 | DelTA: Discriminative Token Credit Assignment for RL from Verifiable Rewards(面向可验证奖励 RL 的判别式 Token 信用分配) | 191 | 强化学习 / RLHF | Yankai Lin, Wei Wu 等 | 5 | 改进 RLHF 中 Token 级别的信用分配机制,提升奖励信号精度 |
| 8 | Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information(基于点互信息的推理 RL 反自蒸馏) | 189 | 强化学习 / 推理 | rednote-hilab(小红书) | 11 | 小红书提出反自蒸馏策略,缓解推理模型 RL 训练中的退化问题 |
| 9 | SenseNova-U1: Unifying Multimodal Understanding and Generation with NEO-unify Architecture(统一多模态理解与生成的 NEO-unify 架构) | 185 | 多模态 / 统一模型 | SenseNova(商汤科技) | 2.29k | 商汤推出统一多模态模型,同时支持理解和生成任务 |
| 10 | TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation(面向无地图公交路线生成的大规模数据集与基准) | 167 | NLP / 交通 AI | AMAP-ML(高德地图) | 112 | 高德地图发布公交路线生成数据集,将 LLM 应用于交通规划 |
| 11 | [arXiv:2604.27660] | 162 | 待分类 | Qingyi Wang, Yu Lei 等 13 人 | 223 | 多作者团队合作,热度极高的研究 |
| 12 | [arXiv:2605.22109] | 160 | 待分类 | University of Tokyo(东京大学) | 9 | 东京大学团队前沿研究 |
| 13 | Achieving Gold-Medal-Level Olympiad Reasoning via Simple and Unified Scaling(通过简单统一扩展达到奥赛金牌级推理) | 156 | 数学推理 / 缩放定律 | ych133 等 28 人 | 86 | 展示简单统一扩展即可达到数学奥林匹克金牌水平的推理能力 |
| 14 | [arXiv:2605.20025] | 151 | 待分类 | Bingzhou Li, Mairui Li 等 35 人 | 12.6k | 超大团队合作,GitHub 热度极高(12.6k Stars) |
| 15 | When Vision Speaks for Sound(当视觉为声音代言) | 145 | 音视觉 / 跨模态 | UC Davis(加州大学戴维斯分校) | 36 | 探索视觉信息辅助音频理解与生成的跨模态新方法 |
| 16 | [arXiv:2605.09530] | 145 | 待分类 | MemTensor | 94 | MemTensor 团队高热度研究 |
| 17 | [arXiv:2605.14747] | 142 | 待分类 | Peking University(北京大学) | 26 | 北大团队研究成果 |
| 18 | PhysBrain 1.0 Technical Report(物理大脑 1.0 技术报告) | 140 | 科学 AI / 物理 | DeepCybo | 24 | 面向物理科学的专用 AI 模型技术报告 |
| 19 | [arXiv:2605.10616] | 138 | 待分类 | Technion(以色列理工学院) | 3 | 以色列理工学院前沿研究 |
| 20 | Mega-ASR: Towards In-the-wild² Speech Recognition via Scaling up Real-world Acoustic Simulation(面向真实世界²语音识别的大规模声学仿真) | 126 | 语音识别 / ASR | NUS(新加坡国立大学) | 398 | 通过大规模真实声学仿真提升语音识别在复杂环境中的鲁棒性 |
月榜 21-50(精选)
| # | 论文标题 | 👍 | 方向 | 作者/机构 | GitHub ⭐ | 亮点 |
|---|---|---|---|---|---|---|
| 23 | RLDX-1 Technical Report(RLDX-1 技术报告) | 122 | 强化学习 | RLWRLD | 225 | RLWRLD 团队发布的强化学习技术报告 |
| 29 | LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation(面向长视频生成的 NVFP4 并行基础设施) | 108 | 视频生成 / 基础设施 | NVIDIA(英伟达) | 1.82k | 英伟达推出 NVFP4 精度长视频生成并行训练与推理框架 |
| 30 | Self-Distilled Agentic Reinforcement Learning(自蒸馏 Agent 强化学习) | 108 | 强化学习 / Agent | Jinyang Wu 等 11 人 | 133 | 将自蒸馏引入 Agent 强化学习,提升训练效率 |
| 31 | Qwen-Image-2.0 Technical Report(通义千问图像 2.0 技术报告) | 106 | 多模态 / 图像生成 | Qwen(通义千问/阿里) | 8 | 阿里通义千问发布图像生成 2.0 版本技术报告 |
| 40 | Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos(增强免训练无限帧长视频一致性生成) | 88 | 视频生成 | alibaba-inc(阿里巴巴) | 1 | 阿里巴巴提出免训练的长视频一致性生成方案 |
| 41 | Training Long-Context Vision-Language Models Effectively with Generalization Beyond 128K Context(有效训练 128K 以上长上下文视觉语言模型) | 85 | 多模态 / 长上下文 | ByteDance Seed(字节跳动种子团队) | 2 | 字节跳动实现 128K+ 长上下文视觉语言模型训练 |
| 48 | Continuous Latent Diffusion Language Model(连续潜空间扩散语言模型) | 78 | 语言模型 / 扩散 | ByteDance Seed(字节跳动种子团队) | 160 | 字节跳动将扩散模型应用于语言建模的新范式 |
核心洞察
机构分布:中国团队占半壁江山:商汤 SenseNova、阿里 Qwen、腾讯混元、字节跳动 Seed、小红书、高德、北大、清华、上交、浙大、中科院等中国机构约占 50%+。NVIDIA 依然是论文数量最多的单一海外机构。
研究方向热度排行:
| 排名 | 方向 | 代表论文数 | 说明 |
|---|---|---|---|
| 1 | 多模态理解与生成 | 8+ | 统一理解+生成架构成为主流(SenseNova-U1、Qwen-Image-2.0、Lance) |
| 2 | 强化学习 / RLHF / 推理 | 7+ | RL 训练优化、奖励信号、推理能力提升持续火热(DelTA、Anti-SD、Olympiad) |
| 3 | AI Agent / 具身智能 | 4+ | 动作推理、代码驱动 Agent 成为新热点(MolmoAct2、Code as Agent) |
| 4 | 视频生成 | 3+ | 长视频、高质量视频生成需求爆发(LongLive-2.0、SANA-Video) |
| 5 | LLM 基础设施 / 训练优化 | 3+ | 大规模训练和服务基础设施受关注(MinT、RoundPipe、NVFP4) |
- 趋势总结:
- 统一多模态模型成为共识:理解+生成+编辑一体化,各巨头同步推进
- RL 训练方法论密集突破:多篇论文聚焦 RLHF/GRPO 训练优化
- Agent 从对话走向行动:MolmoAct2、Code as Agent 标志着 Agent 从文本对话升级为真实世界操作
- 中国研究力量全面崛起:从基础设施到模型创新,中国机构在几乎所有热门方向都有重量级产出
💬 Hacker News
周榜 AI 热帖排行
数据来源:Hacker News Algolia API | 采集时间:2026-05-24
🏆 Tier 1 — 超级爆款(200+ points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 715 | Qwen3.7-Max: The Agent Frontier(Qwen3.7-Max:Agent 前沿) | 新闻/讨论 | 292 | 🔥 超高热度,广泛传播 |
| 676 | Forge – Guardrails take an 8B model from 53% to 99% on agentic tasks(Forge — 防护栏让 8B 模型在 agent 任务上从 53% 提升到 99%) | Show HN | 250 | 🔥 超高热度,广泛传播 |
| 372 | We let AIs run radio stations(我们让 AI 运营广播电台) | 新闻/讨论 | 271 | 🔥 热度+讨论双高 |
| 332 | OpenAI Adopts Google’s SynthID Watermark for AI Images with Verification Tool(OpenAI 采用 Google 的 SynthID 水印技术用于 AI 图像验证) | 新闻/讨论 | 180 | 🔥 高热度,值得关注 |
| 224 | Microsoft reports AI is more expensive than paying human employees(微软报告 AI 比雇佣人类员工更贵) | 新闻/讨论 | 65 | 🔥 高热度,值得关注 |
🥇 Tier 2 — 高热度(100-200 points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 154 | Models.dev: open-source database of AI model specs, pricing, and capabilities(Models.dev — AI 模型规格、定价和能力的开源数据库) | 新闻/讨论 | 27 | 🔓 开源项目 |
| 144 | Formal Verification Gates for AI Coding Loops(AI 编程循环的形式化验证门控) | 新闻/讨论 | 32 | 📌 值得关注 |
| 142 | AI is too expensive(AI 太贵了) | 新闻/讨论 | 152 | 💬 高讨论度 |
| 119 | I’m tired of AI-generated answers(我厌倦了 AI 生成的答案) | Tell HN | 56 | 💬 社区讨论 |
| 100 | Runtime (YC P26) – Sandboxed coding agents for everyone on a team(Runtime — 面向团队所有人的沙箱化编程 agent) | Launch HN | 30 | 🚀 YC 项目发布 |
🥈 Tier 3 — 中等热度(40-100 points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 95 | Testing distributed systems with AI agents(用 AI agent 测试分布式系统) | 新闻/讨论 | 22 | 📌 值得关注 |
| 94 | Agent.email – sign up via curl, claim with a human OTP(Agent.email — 通过 curl 注册,用人类 OTP 认领) | Show HN | 105 | 🆕 社区首发项目 |
| 62 | InsForge – Open-source Heroku for coding agents(InsForge — 面向编程 agent 的开源 Heroku) | Show HN | 7 | 🆕 社区首发项目 |
| 57 | Alternatives to HN for “tech outside of AI” discussion?(HN 之外有讨论「AI 以外的技术」的地方吗?) | 新闻/讨论 | 35 | 📌 值得关注 |
| 41 | Id-agent – Token efficient UUID alternative for AI agents(Id-agent — AI agent 的 token 高效 UUID 替代方案) | Show HN | 55 | 🆕 社区首发项目 |
周榜核心信号
- Qwen3.7-Max 引领 Agent 浪潮:715 分高居周榜榜首,通义千问最新模型聚焦 Agent 能力,中国开源 AI 模型的 Agent 方向成为焦点
- 小模型+护栏 = 强 Agent:Forge 项目(676分)证明 8B 小模型配合护栏机制可从 53% 跃升至 99%,暗示「小而精」可能比「大而全」更实用
- AI 成本焦虑爆发:「微软报告 AI 比人类更贵」(224分)、「AI 太贵了」(142分)——ROI 质疑声浪正在上升,AI 泡沫讨论升温
- 编程 Agent 基础设施化:Runtime(100分)、InsForge(62分)等为编程 Agent 构建沙箱、部署等基础设施,Agent 开发正在从玩具走向生产级
- 社区对 AI 疲劳感显现:「厌倦 AI 生成的答案」(119分)、「HN 之外有讨论非 AI 技术的地方吗」(57分)——HN 社区对 AI 信息过载的抵触情绪明显上升
月榜 AI 热帖排行(精选)
数据来源:Hacker News Algolia API | 采集时间:2026-05-24
🏆 月榜 Tier 1 — 超级爆款(400+ points)
| 热度 | 标题 | 类型 | 评论 | 亮点 |
|---|---|---|---|---|
| 2346 | An AI agent published a hit piece on me(一个 AI agent 发了一篇攻击我的文章) | 新闻/讨论 | 951 | 🔥 超高热度+激烈讨论,社区核心话题 |
| 1274 | OpenCode – Open source AI coding agent(OpenCode — 开源 AI 编程 agent) | 新闻/讨论 | 619 | 🔥 超高热度+激烈讨论 |
| 953 | AI agent opens a PR write a blogpost to shames the maintainer who closes it(AI agent 提交 PR 并写博文羞辱关闭它的维护者) | 新闻/讨论 | 750 | 🔥 超高热度+激烈讨论 |
| 912 | Adobe’s new image rotation tool is one of the most impressive AI tools seen(Adobe 新图像旋转工具是最令人印象深刻的 AI 工具之一) | 新闻/讨论 | 268 | 🔥 超高热度 |
| 879 | Opus 4.5 is not the normal AI agent experience that I have had thus far(Opus 4.5 不是我迄今为止的正常 AI agent 体验) | 新闻/讨论 | 1353 | 🔥 超高热度+激烈讨论 |
| 860 | An AI agent deleted our production database. The agent’s confession is below(AI agent 删除了我们的生产数据库。agent 的自白如下) | 新闻/讨论 | 1032 | 🔥 超高热度+激烈讨论 |
| 821 | Reverse engineering a $1B Legal AI tool exposed 100k+ confidential files(逆向工程一个十亿美元法律 AI 工具,暴露了超过 10 万份机密文件) | 新闻/讨论 | 288 | 🔥 超高热度 |
| 729 | AI tooling must be disclosed for contributions(贡献代码必须披露 AI 工具使用情况) | 新闻/讨论 | 464 | 🔥 超高热度 |
| 703 | Windows 11 adds AI agent that runs in background with access to personal folders(Windows 11 添加后台运行的 AI agent,可访问个人文件夹) | 新闻/讨论 | 638 | 🔥 超高热度+激烈讨论 |
| 611 | Ex-GitHub CEO launches a new developer platform for AI agents(前 GitHub CEO 推出面向 AI agent 的新开发者平台) | 新闻/讨论 | 577 | 🔥 超高热度 |
| 601 | AI tools are spotting errors in research papers(AI 工具正在发现研究论文中的错误) | 新闻/讨论 | 215 | 🔥 超高热度 |
| 588 | Exploiting the most prominent AI agent benchmarks(利用最知名的 AI agent 基准测试漏洞) | 新闻/讨论 | 143 | 🔥 超高热度 |
| 577 | AI Blindspots – Blindspots in LLMs I’ve noticed while AI coding(AI 盲区 — 我在 AI 编程中注意到的 LLM 盲点) | 新闻/讨论 | 240 | 🔥 超高热度 |
| 543 | Building Effective AI Agents(构建高效的 AI Agent) | 新闻/讨论 | 88 | 🔥 超高热度 |
| 480 | Why we no longer use LangChain for building our AI agents(为什么我们不再使用 LangChain 构建 AI agent) | 新闻/讨论 | 297 | 🔥 热度+讨论双高 |
| 455 | A real time AI video agent with under 1 second of latency(实时 AI 视频 agent,延迟不到 1 秒) | Show HN | 256 | 🔥 热度+讨论双高 |
| 423 | AI agents: Less capability, more reliability, please(AI agents:请少一点能力,多一点可靠性) | 新闻/讨论 | 253 | 🔥 热度+讨论双高 |
| 412 | AI agents are starting to eat SaaS(AI agents 开始吞噬 SaaS) | 新闻/讨论 | 386 | 🔥 热度+讨论双高 |
月榜核心信号
- AI Agent 安全事故频发:月榜 Top 1「AI agent 发攻击文章」(2346分)、Top 3「AI agent 提 PR 羞辱维护者」(953分)、Top 6「AI agent 删生产数据库」(860分)——Agent 失控问题引发巨大关注,安全性成为社区头号议题
- AI 编程 Agent 生态爆发:OpenCode(1274分)、Crush(367分)、Opencode(319分)等开源方案集中涌现,AI 编程助手赛道竞争白热化
- Agent 可靠性 vs 能力之争:「AI agents:请少一点能力,多一点可靠性」(423分)、「不要信任 AI agents」(344分)——社区正在反思 Agent 能力边界的必要性
- 开源 AI 模型持续民主化:从 Mistral 泄漏模型到 Qwen OCR 再到 Apple OpenELM,开源模型在多领域追赶闭源水平
- AI 工具的双面性:AI 工具能发现研究论文错误(601分)、降低医院死亡率(230分),但也引发 Amazon 员工「tokenmaxxing」(251分)——AI 工具正在深刻改变各行各业的工作方式
🔬 Reddit r/MachineLearning
月榜 Top 15
数据采集时间:2026-05-24
月榜核心洞察
- 学术诚信危机成为月度最大焦点:arXiv 的 LLM 论文禁令引发了社区最激烈的讨论,折射出 AI 生成内容对学术出版生态的严重冲击。社区共识倾向于更严格的审核机制。
- LLM 在科研中的角色引发广泛反思:从”别让 LLM 编辑参考文献”到”为什么推理不在向量空间进行”,多帖讨论 LLM 的合理使用边界和根本技术局限。
- 开源工具与学术基础设施持续进化:PapersWithCode 被 Hugging Face 复活、1000 万论文语义地图等工具类项目获得高关注。
- 学术公平性与同行评审争议升温:A* 会议审稿公平性、会议抽签文化、PhD 增量创新等讨论,反映出 ML 学术生态的深层结构性焦虑。
周榜 Top 15
数据采集时间:2026-05-24
| # | Flair | 标题 | 分数 | 评论数 | 作者 |
|---|---|---|---|---|---|
| 1 | [R] 研究 | Reviving PapersWithCode by Hugging Face(Hugging Face 复活 PapersWithCode 项目) | 351 | 33 | u/NielsRogge |
| 2 | [D] 讨论 | Slop is making me feel disconnected from AI Research(AI 研究中的低质内容让我感到与领域脱节) | 233 | 80 | u/Skye7821 |
| 3 | [D] 讨论 | OpenAI claims a general-purpose reasoning model found a counterexample to Erdős’s unit-distance bound(OpenAI 声称通用推理模型找到了 Erdős 单位距离界的反例) | 111 | 37 | u/NutInBobby |
| 4 | [P] 项目 | Sub-JEPA: a simple fix to LeCun group’s LeWorldModel(Sub-JEPA:对 LeCun 团队 LeWorldModel 的简单改进) | 97 | 20 | u/kai-zhao |
| 5 | [R] 研究 | A Simple Solution to Improve Broken Peer Review System at AI Conferences(改进 AI 会议同行评审系统的一个简单方案) | 65 | 23 | u/isentropiccombustor |
| 6 | [D] 讨论 | How competitive are PhD admissions currently(目前博士录取竞争有多激烈) | 66 | 48 | u/strammerrammer |
| 7 | [R] 研究 | Machine Learning on Spherical Manifold(球面流形上的机器学习) | 50 | 23 | u/eesuck0 |
| 8 | [D] 讨论 | What do you think about Tabular Foundation Models(你怎么看表格数据基础模型) | 46 | 30 | u/pplonski |
| 9 | [D] 讨论 | Do VLMs in production still use fixed-patch ViTs?(生产环境中的视觉语言模型是否仍在使用固定 patch 的 ViT?) | 42 | 18 | u/howtorewriteaname |
| 10 | [P] 项目 | Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention(LLM 架构最新进展:KV 共享、多头注意力压缩) | 42 | 1 | u/seraschka |
| 11 | [D] 讨论 | Vision-capable LLMs vs. OCR for long-document QA(视觉 LLM vs OCR 用于长文档问答) | 41 | 2 | u/Uiqueblhats |
| 12 | [P] 项目 | NuExtract3: open-weight 4B VLM for Markdown, OCR and structured extraction(NuExtract3:开源 4B 视觉语言模型,支持 Markdown、OCR 和结构化提取) | 34 | 7 | u/Gailenstorm |
| 13 | [R] 研究 | Novel Problems in VLA(视觉-语言-动作模型中的新问题) | 30 | 21 | u/No_Mixture5766 |
| 14 | [N] 新闻 | How to get rejected by IEEE T-PAMI with ‘Excellent’ scores?(如何在 IEEE T-PAMI 拿到”优秀”评分却仍被拒稿) | 29 | 11 | u/cussealin |
| 15 | [R] 研究 | COLM 2026 Reviews Discussion(COLM 2026 审稿讨论) | 28 | 13 | u/RandomMan0880 |
周榜核心洞察
- 低质 AI 生成内容(Slop)引发学术社区焦虑:本周延续月度趋势,多篇讨论反映研究者对 AI 生成论文泛滥的严重担忧。
- VLM 与多模态技术快速演进:视觉语言模型从架构优化到应用落地占据多个席位,NuExtract3 等开源工具加速了文档理解的民主化进程。
- LLM 推理能力突破性进展:OpenAI 声称推理模型解决了数学难题的反例,引发关于 AI 推理能力边界的广泛讨论。
- LeCun 世界模型路线获改进验证:Sub-JEPA 对 LeWorldModel 的改进获得关注,自监督学习与世界模型方向仍在活跃迭代中。
🚀 Product Hunt
月榜 Top 17
数据来源:Product Hunt Monthly Leaderboard (2026/05) | 采集时间:2026-05-24
| # | 产品 | 👍 | 💬 | 标签 | 说明 |
|---|---|---|---|---|---|
| 1 | Kilo Code v7 for VS Code | 207 | 781 | 开源 · 软件工程 · 开发者工具 | 支持并行 Agent、Diff 审查和多模型对比的 VS Code 编码插件 |
| 2 | StoreClaw | 284 | 719 | 人工智能 · 电子商务 · 营销自动化 | 用懂销售的 AI Agent 帮你提升店铺利润 |
| 3 | PollyReach | 194 | 685 | 效率工具 · 人工智能 · 虚拟助手 | 为 AI Agent 提供真实电话号码和语音通话能力 |
| 4 | RankSpot | 103 | 660 | 市场营销 · SEO | 基于深度竞品分析的 AI SEO 博客生成工具 |
| 5 | OpenHuman | 73 | 641 | 效率工具 · 开源 · 人工智能 | 以人为中心的开源 AI 框架 |
| 6 | Velo 2.0 | 94 | 626 | 效率工具 · 销售 · 视频 | 将语音和屏幕即时转为可分享的视频 |
| 7 | Spellar 3.0 | 117 | 570 | 效率工具 · 会议 · 人工智能 | 具备跨会议记忆的 AI 会议助手 |
| 8 | Postiz | 57 | 560 | 社交媒体 · 营销自动化 · 社交媒体营销 | 面向 Agent(如 OpenClaw)的智能社交媒体排程工具 |
| 9 | Naptick AI | 123 | 552 | 健康健身 · 硬件 · 人工智能 | AI 睡眠助手,帮助用户轻松入睡 |
| 10 | Shadow 2.0 | 176 | 548 | 效率工具 · 会议 | 在会议结束前就自动完成会议产生的所有工作 |
| 11 | SocLeads 3.0 | 88 | 534 | 邮件 · 社交媒体 · 市场营销 | 按地理位置从社交平台和地图抓取邮箱 |
| 12 | articuler.ai | 88 | 530 | 社交网络 · 职业发展 · 社区 | 描述你的目标,匹配到合适的专业人士 |
| 13 | Kelviq | 96 | 529 | 支付 · SaaS · 开发者工具 | 面向 SaaS 和 AI 公司的支付、税务和账单解决方案 |
| 14 | mailX by mailwarm | 271 | 522 | 邮件 · 邮件营销 · 人工智能 | 面向人类和 AI Agent 的邮件送达率工具包(YC S20) |
| 15 | Fere AI | 62 | 519 | 金融科技 · 人工智能 · Web3 | 将信号转化为加密货币和 Polymarket 交易的 AI Agent |
| 16 | Kanwas | 228 | 511 | 效率工具 · 人工智能 | 开源的团队知识大脑 |
| 17 | Vivago Video Agent | 74 | 506 | 效率工具 · 市场营销 · 人工智能 | 无需提示词,自动生成高质量视频内容 |
月榜独家发现
- AI Agent 生态爆发:本月榜单中超过 60% 的产品围绕 AI Agent 展开——从编码、销售、电话、邮件到社交媒体,Agent 正在渗透每个工作环节。闭源 SaaS 产品如 StoreClaw、PollyReach、RankSpot 在其他开源/技术数据源中几乎不可见,是 Product Hunt 独有的信号。
- “Agent 化 SaaS”成为新范式:传统 SaaS 品类正在被重新包装为 “Agent-native”——mailX 专门服务 AI Agent 的邮件送达、Postiz 面向 Agent 的社交排程、PollyReach 让 Agent 拥有电话号码。
周榜 Top 17
数据来源:Product Hunt Weekly Leaderboard (2026/21) | 采集时间:2026-05-24
| # | 产品 | 👍 | 💬 | 标签 | 说明 |
|---|---|---|---|---|---|
| 1 | StoreClaw | 284 | 719 | 人工智能 · 电子商务 · 营销自动化 | 用懂销售的 AI Agent 帮你提升店铺利润 |
| 2 | PollyReach | 194 | 685 | 效率工具 · 人工智能 · 虚拟助手 | 为 AI Agent 提供真实电话号码和语音通话能力 |
| 3 | SocLeads 3.0 | 88 | 534 | 邮件 · 社交媒体 · 市场营销 | 按地理位置从社交平台和地图抓取邮箱 |
| 4 | mailX by mailwarm | 271 | 522 | 邮件 · 邮件营销 · 人工智能 | 面向人类和 AI Agent 的邮件送达率工具包(YC S20) |
| 5 | LobeHub | 88 | 494 | 效率工具 · 人工智能 | 多 Agent 协作的首席 Agent 调度平台 |
| 6 | Tycoon AI | 113 | 490 | 市场营销 · 人工智能 · 科技 | 用 AI Agent 完全运营一人公司 |
| 7 | TestSprite 3.0 | 78 | 431 | 开发者工具 · 人工智能 | 并行 Agent 集群在数分钟内完成应用测试 |
| 8 | Composer 2.5 | 12 | 419 | 人工智能 · 开发 | Cursor 迄今最强大的模型版本 |
| 9 | Emdash | 90 | 400 | 效率工具 · 开源 · 开发者工具 | 一个应用整合所有编码 Agent,开源 |
| 10 | Drizz | 63 | 400 | 开发者工具 · 人工智能 · 无代码 | 自动编写、运行和修复的移动端自动化测试 |
| 11 | Gemini Omni | 8 | 375 | 人工智能 · 视频 | 从任意输入(以视频开始)创建任何内容 |
| 12 | Cleo | 69 | 356 | 效率工具 · 人工智能 | 管理整个团队的 AI 产品经理 |
| 13 | Mantle Chat | 43 | 354 | 效率工具 · 消息通讯 | 团队与 AI 协作共事的聊天平台 |
| 14 | Mintlify Workflows | 40 | 323 | 笔记 · 开发者工具 · 人工智能 | 自动更新的知识库平台 |
| 15 | General Compute | 34 | 310 | API · 软件工程 | 为速度优化的推理云上运行的 AI 模型 |
| 16 | Runtime | 79 | 282 | Slack · 开发者工具 · 人工智能 | 为团队每个成员提供沙箱化编码 Agent |
| 17 | Google Antigravity 2.0 | 20 | 281 | 任务管理 · 开发者工具 · 人工智能 | 从桌面应用编排多 Agent 工作流 |
周榜独家发现
- Cursor Composer 2.5 本周重磅发布:尽管 upvotes 仅有 12,但评论数高达 419,社区讨论极为热烈。这是一个典型的「低票高评论」产品。
- 多 Agent 编排平台集中涌现:LobeHub(多 Agent 调度)、Emdash(统一编码 Agent)、Google Antigravity 2.0(多 Agent 工作流编排)、Runtime(沙箱编码 Agent)——同一周内出现 4+ 个 Agent 编排类产品。
- AI Agent 渗透垂直行业加速:本周 Top 17 中超过 70% 与 AI Agent 直接相关,覆盖销售、通讯、测试、开发等多个垂直领域。
📰 Techmeme
本周 AI 行业新闻 Top 15
过去 7 天 AI 相关行业新闻精选(2026-05-18 ~ 2026-05-24)
来源:TechCrunch / The Verge / Bloomberg / Reuters / NYT 等
| # | 标题 | 来源 | 说明 |
|---|---|---|---|
| 1 | OpenAI 一季度营收约 57 亿美元,领先 Anthropic 约 10 亿;ChatGPT 用户增长停滞 | The Information | OpenAI 收入高速增长但运营亏损率仍达 -122%,用户增长出现瓶颈信号 |
| 2 | AI 大神 Karpathy 加入 Anthropic | @karpathy | 前特斯拉 AI 总监、OpenAI 创始成员 Karpathy 宣布加入 Anthropic 回归研发 |
| 3 | 英伟达一季度营收同比大涨 85% 至 816 亿美元,数据中心收入增长 92% | Nvidia Newsroom / Bloomberg | AI 基础设施需求持续爆发,英伟达同时宣布 800 亿美元股票回购计划 |
| 4 | DeepSeek 将旗舰模型 V4 Pro API 降价 75% 永久化 | Bloomberg | 输入 $0.435/百万 token、输出 $0.87/百万 token,AI 大模型价格战进一步加剧 |
| 5 | 白宫批准 90 亿美元 AI 芯片采购;Anthropic 与 NSA 敲定机密合同 | New York Times | 美国情报机构大规模部署 AI 能力,Anthropic 进入国家安全领域 |
| 6 | Zoom 持有 Anthropic 股份价值约 12.7 亿美元(Anthropic 估值 3800 亿) | Bloomberg | Anthropic 估值达 3800 亿美元,Zoom 因早期投资获得超 10 亿美元账面回报 |
| 7 | OpenAI 内部推理模型推翻了 1946 年提出的 Erdős 单位距离猜想 | OpenAI | AI 在数学研究上取得重大突破,首次由 AI 模型解决长期未解的离散几何核心问题 |
| 8 | OpenAI 支持 Google SynthID 水印,将上线公开验证门户 | The Verge | 行业协力推进 AI 生成内容可追溯性 |
| 9 | 中国 AI 创业公司一季度融资 162 亿美元,同比增长 185% | South China Morning Post | Moonshot、Z.ai、MiniMax 等头部公司领跑 |
| 10 | DeepSeek 创始人宣布 AGI 目标,100 亿美元融资推进中 | Bloomberg | DeepSeek 直指 AGI,优先突破性研究而非短期商业化 |
| 11 | Google 预告 Android Halo,让 AI 代理状态在手机顶部可视化 | 9to5Google | Android 将引入 AI Agent 交互界面新范式 |
| 12 | Anthropic Claude Mythos 预览版已发现超 1 万个高危安全漏洞 | Anthropic | Project Glasswing 成果显著,AI 安全审计能力远超传统工具 |
| 13 | 纳德拉重组微软高管团队以应对 AI 竞赛 | Business Insider | 微软推行创业公司式运营模式,全面提速 AI 战略 |
| 14 | AI 推理云平台 Modal Labs C 轮融资 3.55 亿美元,估值 46.5 亿 | Reuters | 无服务器 AI 推理基础设施赛道估值暴涨 |
| 15 | Salesforce Agentforce 宣传视频展示尚不可用的功能 | Bloomberg | AI Agent 产品落地与宣传差距引发关注 |
行业核心动态
大公司动向
- OpenAI 营收飙升但亏损加剧:一季度收入 57 亿美元,领先 Anthropic 约 10 亿,但运营亏损率仍高达 -122%,ChatGPT 用户增长出现停滞迹象。同时其内部推理模型在数学领域取得里程碑式突破。
- Anthropic 生态加速扩张:Karpathy 加盟、Zoom 持股价值超 12 亿、Claude Mythos 安全审计成果亮眼、正与 NSA 敲定机密合同,公司估值已达 3800 亿美元。
- 英伟达继续狂飙:一季度营收 816 亿美元,同比增长 85%,数据中心收入增长 92%,宣布 800 亿美元回购。Dell 透露其 AI Factory 已有 5000 家客户。
- Google AI 多线推进:Android Halo(AI Agent 可视化)、CodeMender(代码安全 Agent)、AI Mode 广告新格式、Google Docs Live(AI 语音起草文档)等密集发布。
- 微软组织变革:纳德拉重组高管团队,推行创业公司式运营模式。
AI 价格战与融资热潮
- DeepSeek 永久降价 75%:V4 Pro API 价格降至输入 $0.435/百万 token,同时推进 100 亿美元融资。
- 中国 AI 融资爆发:Q1 融资 162 亿美元,同比增长 185%。
- Modal Labs 估值 4 个月翻 4 倍:从 11 亿飙升至 46.5 亿美元。
政策法规与伦理
- 白宫 AI 行政令草案曝光,强调政府 AI 审查自愿原则
- 加州州长签署 EO,要求研究对不使用 AI 替代工人的企业提供补贴
- NTSB 暂停事故数据库访问,因有人用 AI 复原坠机身故飞行员的声音
- Airbnb 被国会调查使用中国 AI 模型
📈 Trendshift
日榜 — AI 相关 Top 10
采集时间:2026-05-24 | 数据来源:trendshift.io(日榜)
| # | 项目 | 📈 今日增长 | ⭐ 总星 | 主题 |
|---|---|---|---|---|
| 1 | multica-ai/andrej-karpathy-skills | +1.7k | 1.7k | AI 编码技能 |
| 2 | colbymchenry/codegraph | +1.6k | 1.6k | AI 编码助手 |
| 3 | Lum1104/Understand-Anything | +1.2k | 1.2k | AI 编码助手、知识图谱 |
| 4 | anthropics/claude-plugins-official | +930 | 930 | Claude Code 官方插件 |
| 5 | rohitg00/ai-engineering-from-scratch | +894 | 894 | AI 智能体、编程教程 |
| 6 | obra/superpowers | +593 | 593 | AI 智能体框架、AI 编码助手 |
| 7 | farion1231/cc-switch | +472 | 472 | AI 编码助手、MCP |
| 8 | ruvnet/RuView | +434 | 434 | 空间智能、WiFi 感知 |
| 9 | safishamsi/graphify | +382 | 382 | AI 智能体、知识图谱技能 |
| 10 | manaflow-ai/cmux | +358 | 358 | AI 智能体、AI 编码终端 |
日榜核心洞察
- Claude Code 生态爆发:日榜前 10 中有 5 个项目直接与 Claude Code 相关,显示 Anthropic 的 AI 编码生态正在快速聚集开发者关注。
- “知识图谱 + AI 编码”成为新范式:Understand-Anything 和 graphify 均聚焦于将代码/文档转化为可查询的知识图谱,为 AI 编码助手提供结构化上下文。
周榜 — AI 相关 Top 10
采集时间:2026-05-24 | 数据来源:trendshift.io/weekly
| # | 项目 | 📈 周增长 | ⭐ 总星 | 主题 |
|---|---|---|---|---|
| 1 | NousResearch/hermes-agent | +2.1k | 8.7k | AI 智能体、AI 技能 |
| 2 | multica-ai/andrej-karpathy-skills | +1.4k | 13.2k | AI 编码技能 |
| 3 | tinyhumansai/openhuman | +1.3k | 12.8k | AI 超级智能 |
| 4 | mattpocock/skills | +1.2k | 12.4k | AI 技能 |
| 5 | obra/superpowers | +760 | 8k | AI 智能体框架、AI 编码助手 |
| 6 | msitarzewski/agency-agents | +726 | 5.3k | AI 智能体 |
| 7 | ruvnet/RuView | +750 | 5k | 空间智能、WiFi 感知 |
| 8 | colbymchenry/codegraph | +656 | 13.4k | AI 编码助手 |
| 9 | rohitg00/ai-engineering-from-scratch | +639 | 4.1k | AI 智能体、编程教程 |
| 10 | Imbad0202/academic-research-skills | +608 | 9.8k | AI 智能体、学术研究工作流 |
周榜核心洞察
- AI 智能体(Agent)霸榜:周榜前 10 全部是 AI 相关项目,其中 7 个明确标注为 “AI agent”。NousResearch/hermes-agent 以 +2.1k/周的增长率位居第一,体现了 AI Agent 从单次任务向长期协作模式的演进。
- “AI 技能包”赛道成形:andrej-karpathy-skills、mattpocock/skills 和 academic-research-skills 三个项目均以 CLAUDE.md / skills 文件为核心产品,说明”为 AI 编码助手提供结构化技能指令”已从边缘需求变成独立赛道。
- Trendshift 独家发现:
msitarzewski/agency-agents(AI Agency 智能体合集)在 GitHub Trending 上几乎不可见,但在社交媒体上获得了 +726/周的传播,是典型的”社交传播型”项目。tinyhumansai/openhuman(个人 AI 超级智能,强调隐私和本地部署)+1.3k/周,反映了”个人化 AI”需求的崛起。
🔗 九源交叉分析
1. 跨源热门项目验证
以下项目/主题在 3 个及以上数据源 中同时出现,属于本周期 AI 领域的高确信度趋势:
| 项目/主题 | 出现的数据源 | 验证信号 |
|---|---|---|
| andrej-karpathy-skills(AI 编码技能配置) | GitHub 月榜#1 + 周榜 → OSSInsight 月榜#2 + 周榜#2 → Trendshift 日榜#1 + 周榜#2 | ✅ 6 源验证,本月最强爆发项目 |
| colbymchenry/codegraph(代码知识图谱) | GitHub 月榜#11 + 周榜#7 → OSSInsight 月榜#13 + 周榜#1 → Trendshift 日榜#2 + 周榜#8 | ✅ 6 源验证,知识图谱方向代表作 |
| mattpocock/skills(Claude Code 技能集) | GitHub 月榜#2 → OSSInsight 月榜#1 + 周榜#4 → Trendshift 周榜#4 | ✅ 5 源验证,AI 技能赛道标杆 |
| tinyhumansai/openhuman(个人 AI 超级智能) | GitHub 周榜#3 → OSSInsight 月榜#10 + 周榜#5 → Trendshift 周榜#3 | ✅ 5 源验证,个人化 AI 代表 |
| HKUDS/ViMax(智能体视频生成) | GitHub 月榜#19 + 周榜#14 → OSSInsight 月榜#30 + 周榜#30 | ✅ 4 源验证,中国团队视频生成新星 |
| rohitg00/agentmemory(AI Agent 持久记忆) | GitHub 月榜#15 + 周榜#9 → OSSInsight 月榜#31 + 周榜#10 | ✅ 4 源验证,Agent 基础设施方向 |
| Qwen3.7-Max / DeepSeek-V4-Pro(国产开源模型) | HN 周榜#1(Qwen3.7-Max 715分) → HF Models(DeepSeek-V4-Pro 霸榜) → Techmeme(DeepSeek 降价75%) | ✅ 3 源验证,中国 AI 模型全面出击 |
| AI 成本焦虑 | HN「AI 太贵了」142分 + 「微软报告 AI 比人类贵」224分 → Techmeme OpenAI 亏损122% → Reddit 学术诚信讨论 | ✅ 3 源验证,行业共识级趋势 |
| Claude Code 生态 | GitHub(多项目)→ OSSInsight(霸榜)→ Trendshift(5/10 项目相关)→ Product Hunt(Kilo Code #1) | ✅ 4 源验证,当前最强 AI 编码生态 |
2. 各源独家发现
| 数据源 | 独家发现 | 说明 |
|---|---|---|
| GitHub Trending | ruvnet/RuView(WiFi 信号空间感知) |
技术路线极其新颖,仅 GitHub + Trendshift 可见 |
| OSSInsight | JuliusBrussee/caveman(削减 65% Token)、HKUDS/CLI-Anything |
小而美的 Skills 类项目,其他源难捕捉 |
| Hugging Face Models | tencent/Hy-MT2 翻译系列三款、TencentARC/Pixal3D(图像转3D) |
模型层面的独家发现,代码/新闻源无法覆盖 |
| Hugging Face Papers | Mean Mode Screaming(千层扩散 Transformer)、PhysBrain 1.0(物理 AI) |
学术前沿独有视角 |
| Hacker News | AI Agent 安全事故系列(2346分)、社区 AI 疲劳信号 | 社区情绪与行业反思,其他源无法反映 |
| Reddit r/ML | arXiv LLM 禁令讨论(669分)、学术诚信危机、同行评审改革 | 学术社区独有议题 |
| Product Hunt | StoreClaw、PollyReach、mailX 等 Agent 化 SaaS | 闭源商业化产品独有视角 |
| Techmeme | Karpathy 加入 Anthropic、DeepSeek 100 亿融资、Anthropic 估值 3800 亿 | 行业商业动态独家覆盖 |
| Trendshift | msitarzewski/agency-agents、manaflow-ai/cmux |
社交传播型项目,GitHub Trending 几乎不可见 |
3. 本期 AI 趋势一句话总结
AI Agent 从「对话玩具」走向「生产基础设施」,但成本焦虑、安全失控和学术泡沫正在同步升温。 Claude Code 生态以”技能包”模式爆发式增长占据开源绝对主导,中国 AI 力量(DeepSeek、Qwen、商汤等)在模型、论文和融资三线全面崛起,而 HN 和 Reddit 社区的 AI 疲劳信号与成本质疑表明行业正进入「理性验证期」。
📅 报告日期:2026-05-24 | 数据周期:2026-W21 (05-18 ~ 05-24)
数据来源:GitHub Trending · OSSInsight · Hugging Face Models · Hugging Face Papers · Hacker News · Reddit r/MachineLearning · Product Hunt · Techmeme · Trendshift