AI 趋势周报:2026-W21

🤖 AI 趋势周报 · 2026-W21 (05-18 - 05-24)


📊 GitHub Trending

月榜 Top 20

数据采集时间:2026-05-24 | 来源:github.com/trending?since=monthly

# 项目 语言 ⭐ 总计 📈 本月新增 说明
1 multica-ai/andrej-karpathy-skills - 150,426 70,773 基于 Andrej Karpathy 观察的 Claude Code 行为优化 CLAUDE.md 文件
2 mattpocock/skills Shell 102,787 85,195 实用工程师技能集合,直接来自作者的 .claude 目录
3 TauricResearch/TradingAgents Python 79,045 26,704 多智能体 LLM 金融交易框架
4 Z4nzu/hackingtool Python 76,372 16,237 一站式黑客工具集
5 ruvnet/ruflo TypeScript 54,573 21,850 Claude 多智能体编排平台,支持群体智能和 RAG 集成
6 addyosmani/agent-skills Shell 45,235 23,686 生产级 AI 编程智能体技能集
7 bytedance/UI-TARS-desktop TypeScript 35,081 5,666 字节跳动开源多模态 AI 智能体栈
8 soxoj/maigret Python 30,107 10,535 通过用户名从 3000+ 网站收集个人信息档案
9 Alishahryar1/free-claude-code Python 28,750 24,512 免费使用 Claude Code 的终端/VSCode/Discord 方案
10 anthropics/financial-services Python 27,141 19,289 Anthropic 官方金融服务行业 AI 解决方案
11 colbymchenry/codegraph TypeScript 20,516 17,463 预索引代码知识图谱,减少 AI 编程工具的 token 消耗
12 Imbad0202/academic-research-skills Python 20,037 16,073 Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿
13 CloakHQ/CloakBrowser Python 19,836 17,847 隐身 Chromium 浏览器,通过所有机器人检测测试
14 AIDC-AI/Pixelle-Video Python 19,431 13,218 AI 全自动短视频引擎
15 rohitg00/agentmemory TypeScript 17,022 14,753 AI 编程智能体的持久化记忆方案,基准测试排名第一
16 decolua/9router JavaScript 13,871 10,813 免费无限 AI 编程路由,连接 40+ 提供商
17 refactoringhq/tolaria TypeScript 11,408 10,527 Markdown 知识库管理桌面应用
18 ComposioHQ/awesome-codex-skills Python 11,336 10,326 Codex CLI/API 实用技能精选列表
19 HKUDS/ViMax Python 7,135 4,152 智能体式视频生成,集成导演、编剧、制片人功能
20 mattpocock/sandcastle TypeScript 4,898 3,929 TypeScript 沙箱化编程智能体编排框架

月榜核心洞察

  1. AI 编程智能体技能成为绝对主流:月榜 Top 20 中,超过 80% 的项目直接与 AI 编程智能体(Claude Code、Codex、Cursor)相关。mattpocock/skills(本月 +85K)、multica-ai/andrej-karpathy-skills(本月 +70K)这类”技能配置”项目爆发式增长,说明 AI 辅助编程已从工具层面升级到”方法论”层面。

  2. Python 和 TypeScript 主导Python(8 个)和 TypeScript/Shell/JavaScript(7 个)合计占比 75%。Python 主要集中在 AI/数据/安全领域,TypeScript/JavaScript 集中在智能体编排和开发者工具。

  3. “免费 AI 编程”成新趋势Alishahryar1/free-claude-code(+24K)和 decolua/9router(+10K)都是帮助用户免费使用 AI 编程工具的路由/代理项目,反映出开发者对 AI 编程工具的强烈需求和付费门槛的矛盾。

  4. 中国力量崛起AIDC-AI/Pixelle-Video(阿里系,全自动短视频引擎)、HKUDS/ViMax(港大,智能体视频生成)等中国团队项目频繁上榜,AI 视频生成是中国团队的优势赛道。

周榜 Top 14

数据采集时间:2026-05-24 | 来源:github.com/trending?since=weekly

# 项目 语言 ⭐ 总计 📈 本周新增 说明
1 obra/superpowers Shell 204,305 10,367 智能体技能框架与软件开发方法论
2 ruvnet/RuView Rust 64,959 6,741 利用 WiFi 信号实现实时空间智能和生命体征监测,无需摄像头
3 tinyhumansai/openhuman Rust 26,641 16,288 个人 AI 超级智能助手,私有、简单、极其强大
4 K-Dense-AI/scientific-agent-skills Python 25,461 2,522 面向研究、科学、工程、分析、金融和写作的智能体技能集
5 Lum1104/Understand-Anything TypeScript 22,946 4,880 将任意代码转为可交互知识图谱,支持多种 AI 编程工具
6 humanlayer/12-factor-agents TypeScript 22,033 2,035 构建 LLM 驱动软件的 12 个最佳实践原则
7 colbymchenry/codegraph TypeScript 20,517 15,909 预索引代码知识图谱,减少 AI 编程工具的 token 消耗
8 CloakHQ/CloakBrowser Python 19,836 6,991 隐身 Chromium 浏览器,通过所有机器人检测测试
9 rohitg00/agentmemory TypeScript 17,024 6,734 AI 编程智能体的持久化记忆方案
10 rohitg00/ai-engineering-from-scratch Python 14,276 5,026 从零开始学习 AI 工程的实战教程
11 datawhalechina/easy-vibe JavaScript 14,355 2,711 Datawhale 出品的 Vibe Coding 入门课程
12 Imbad0202/academic-research-skills Python 20,040 11,691 Claude Code 学术研究技能:研究→撰写→审阅→修订→定稿
13 supertone-inc/supertonic Swift 9,936 3,281 极速端上多语言 TTS 引擎,基于 ONNX 本地运行
14 HKUDS/ViMax Python 7,135 2,790 智能体式视频生成,集成导演、编剧、制片人功能

周榜核心洞察

  1. 周榜新爆发现象明显tinyhumansai/openhuman(Rust,本周 +16K)和 colbymchenry/codegraph(TypeScript,本周 +15K)是本周最强爆发项目,分别代表了”个人 AI 助手”和”代码理解图谱”两个方向。ruvnet/RuView(Rust,本周 +6.7K)利用 WiFi 信号做空间感知,技术路线新颖。

  2. Rust 语言异军突起:周榜中 Rust 项目有 2 个(openhumanRuView),这是月榜中完全没有出现的语言。高性能、隐私优先的本地 AI 工具正在选择 Rust 作为实现语言。

  3. AI 相关项目占比约 85%:14 个项目中约 12 个直接与 AI 相关(智能体技能、AI 编程工具、TTS、视频生成等),AI 已完全主导 GitHub 热门趋势。


🔍 OSSInsight

月榜 Top 30(按类别)

数据来源:OSSInsight Trending (This Month) | 采集时间:2026-05-24

🤖 AI Coding Agent(编程工具、IDE 插件、代码生成)

# 项目 ⭐ Stars Fork 语言 说明
1 mattpocock/skills 8,928 788 Shell 真正工程师的 Claude Code 技能集,直接来自 .claude 目录
2 forrestchang/andrej-karpathy-skills 8,304 908 - 基于 Karpathy 对 LLM 编程陷阱观察的 CLAUDE.md 改进文件
4 obra/superpowers 3,957 403 Shell Agent 技能框架与软件开发方法论
5 Hmbown/DeepSeek-TUI 3,332 267 Rust DeepSeek 模型的终端编程代理
7 affaan-m/ECC 2,873 463 JavaScript Agent 性能优化系统,含技能、本能、记忆、安全和研究驱动开发
8 farion1231/cc-switch 3,070 233 Rust Claude Code / Codex / Gemini CLI 等跨平台桌面一体化助手工具
9 warpdotdev/warp 3,193 399 - 基于终端的 Agentic 开发环境
11 ruvnet/ruflo 2,674 324 TypeScript Claude 领先的 Agent 编排平台,支持多 Agent 群智能
13 colbymchenry/codegraph 1,840 95 TypeScript 为 Claude Code 预索引的代码知识图谱,减少 Token 消耗
14 addyosmani/agent-skills 2,436 226 Shell 生产级 AI 编程 Agent 工程技能
15 Lum1104/Understand-Anything 1,856 165 TypeScript 将任何代码转化为可交互的知识图谱
18 garrytan/gstack 2,150 365 TypeScript Garry Tan 的 Claude Code 配置,包含 23 个工具角色
20 safishamsi/graphify 2,166 228 Python 将代码文件夹转化为可查询的知识图谱技能
23 anomalyco/opencode 1,815 312 TypeScript 开源编程 Agent
24 anthropics/skills 1,718 235 Python Anthropic 官方 Agent Skills 仓库
27 JuliusBrussee/caveman 1,900 144 Python Claude Code 技能,用”原始人语言”削减 65% Token

🧠 AI Agent 框架(Agent 编排、工作流、基础设施)

# 项目 ⭐ Stars Fork 语言 说明
3 NousResearch/hermes-agent 5,620 1,203 Python 与你一同成长的 Agent 框架
10 tinyhumansai/openhuman 2,059 192 Rust 个人 AI 超级智能体,私有、简单、极其强大
19 msitarzewski/agency-agents 2,017 367 Shell 完整的 AI Agency,从前端到社区运营的专精 Agent 集合
31 rohitg00/agentmemory 1,356 114 TypeScript 基于真实基准测试的 AI 编程 Agent 持久记忆方案

🗣️ AI 语音/多模态(TTS、视频生成、图像生成)

# 项目 ⭐ Stars Fork 语言 说明
30 HKUDS/ViMax 238 31 Python Agentic 视频生成(导演、编剧、制片人、视频生成器一体化)

🤗 AI 研究与数据(基础模型、数据集、研究论文)

# 项目 ⭐ Stars Fork 语言 说明
12 Alishahryar1/free-claude-code 3,029 413 Python 免费使用 Claude Code(终端/VSCode/Discord,支持语音)
16 anthropics/financial-services 1,940 305 Python Anthropic 金融服务领域 Agent Skills
26 Imbad0202/academic-research-skills 1,405 118 Python Claude Code 学术研究技能:研究→撰写→评审→修订→定稿
29 github/spec-kit 1,499 145 Python GitHub 官方规格驱动开发工具包

🛠️ 非 AI 热门(数据库、DevOps、前端等)

# 项目 ⭐ Stars Fork 语言 说明
6 TauricResearch/TradingAgents 3,291 714 Python 多 Agent LLM 金融交易框架
17 VoltAgent/awesome-design-md 2,182 241 - 品牌设计系统 DESIGN.md 集合,让编程 Agent 生成匹配 UI
21 CloakHQ/CloakBrowser 1,704 137 Python 隐身 Chromium,通过所有机器人检测测试的 Playwright 替代品
22 rtk-ai/rtk 2,026 138 Rust CLI 代理,减少 LLM Token 消耗 60-90%
25 D4Vinci/Scrapling 1,789 208 Python 自适应 Web 爬虫框架,从单请求到大规模爬取
28 ruvnet/RuView 1,365 189 Rust 利用 WiFi 信号实现实时空间感知与生命体征监测
30 Z4nzu/hackingtool 2,065 218 Python 一体化黑客工具集

月榜核心洞察

  1. AI 项目绝对霸榜:Top 30 中超过 90% 的项目直接与 AI/LLM 相关,几乎全部围绕 Claude Code、Codex、Cursor 等 AI 编程工具生态展开。
  2. Claude Code 生态爆发:榜单被 Claude Code Skills/Plugins 占据,反映出 Anthropic Claude Code 平台已成为 AI 编程 Agent 的核心基础设施。
  3. Token 优化成为独立赛道:caveman(削减 65% Token)、rtk(减少 60-90% Token)、codegraph(减少 Token 调用)等多个项目专注解决 LLM Token 消耗问题。

周榜 Top 30(按类别)

数据来源:OSSInsight Trending (This Week) | 采集时间:2026-05-24

🤖 AI Coding Agent(编程工具、IDE 插件、代码生成)

# 项目 ⭐ Stars Fork 语言 说明
1 colbymchenry/codegraph 1,548 86 TypeScript 为 Claude Code 预索引的代码知识图谱,减少 Token 消耗
2 forrestchang/andrej-karpathy-skills 1,498 174 - 基于 Karpathy 对 LLM 编程陷阱观察的 CLAUDE.md 文件
3 Lum1104/Understand-Anything 1,079 89 TypeScript 将任何代码转化为可交互的知识图谱
4 mattpocock/skills 1,053 123 Shell 真正工程师的 Claude Code 技能集
6 anthropics/claude-plugins-official 727 37 Python Anthropic 官方管理的高质量 Claude Code 插件目录
7 rohitg00/ai-engineering-from-scratch 647 116 Python 从零学习 AI 工程:学它、建它、发布它
10 rohitg00/agentmemory 490 35 TypeScript 基于真实基准测试的 AI 编程 Agent 持久记忆方案
11 safishamsi/graphify 336 23 Python 将代码文件夹转化为可查询知识图谱的 AI 技能
12 Alishahryar1/free-claude-code 281 48 Python 免费使用 Claude Code(终端/VSCode/Discord)
13 tashfeenahmed/freellmapi 265 38 TypeScript 聚合 ~14 个 AI 提供商免费额度密钥的 OpenAI 兼容代理
18 Hmbown/DeepSeek-TUI 265 23 Rust DeepSeek 模型的终端编程代理
20 HKUDS/CLI-Anything 288 21 Python 让所有软件成为 Agent-Native 的 CLI 工具
22 mukul975/Anthropic-Cybersecurity-Skills 192 14 Python 754 个结构化 AI Agent 网络安全技能,映射 5 大框架
23 hugohe3/ppt-master 223 25 Python AI 从任何文档生成原生可编辑 PPTX
25 deColua/9router 240 26 JavaScript 免费无限 AI 编程,连接 Claude/GPT/Gemini 等 40+ 提供商
27 can1357/oh-my-pi 210 11 TypeScript 终端 AI 编程 Agent,支持哈希锚定编辑和 LSP
28 manaflow-ai/cmux 193 10 Swift 基于 Ghostty 的 macOS 终端,专为 AI 编程 Agent 设计

🧠 AI Agent 框架(Agent 编排、工作流、基础设施)

# 项目 ⭐ Stars Fork 语言 说明
5 tinyhumansai/openhuman 1,003 113 Rust 个人 AI 超级智能体,私有、简单、极其强大
15 multica-ai/multica 267 23 TypeScript 开源托管 Agent 平台,将编程 Agent 变成真正的队友
17 simplifaisoul/osiris 223 38 TypeScript 开源全球情报平台,实时 OSINT 仪表盘,Palantir 替代品

🗣️ AI 语音/多模态(TTS、视频生成、图像生成)

# 项目 ⭐ Stars Fork 语言 说明
26 supertone-inc/supertonic 238 19 Swift 闪电般快速的设备端多语言 TTS,通过 ONNX 原生运行
30 HKUDS/ViMax 238 31 Python Agentic 视频生成(导演、编剧、制片人一体化)

🤗 AI 研究与数据

# 项目 ⭐ Stars Fork 语言 说明
8 Imbad0202/academic-research-skills 742 48 Python Claude Code 学术研究技能:研究→撰写→评审→修订→定稿
19 Yuan1z0825/nature-skills 252 21 Python 符合 Nature 论文学术表达和科研绘图的 Skill
29 anthropics/financial-services 232 40 Python Anthropic 金融服务领域 Agent Skills

🛠️ 非 AI 热门

# 项目 ⭐ Stars Fork 语言 说明
9 CloakHQ/CloakBrowser 530 39 Python 隐身 Chromium,通过所有机器人检测,Playwright 替代品
14 rmyndharis/OpenWA 337 58 TypeScript 免费开源自托管的 WhatsApp API 网关
16 rtk-ai/rtk 283 20 Rust CLI 代理,减少 LLM Token 消耗 60-90%
21 truelockmc/streambert 261 23 JavaScript 跨平台 Electron 桌面应用,零广告追踪的影视动漫流媒体下载
24 Fincept-Corporation/FinceptTerminal 217 25 Python 现代金融应用,提供高级市场分析和投资研究工具

周榜核心洞察

  1. 知识图谱成为本周热点:codegraph (#1)、Understand-Anything (#3)、graphify (#11) 三个项目同时聚焦”代码知识图谱”方向,反映 AI 编程 Agent 对代码理解深度的迫切需求。
  2. 与 GitHub Trending 重叠度约 60-70%:核心重叠项目包括 mattpocock/skills、andrej-karpathy-skills、DeepSeek-TUI、openhuman 等。OSSInsight 的特色在于收录了更多”小而美”的 Skills 类项目。

🤗 Hugging Face Models

采集时间:2026-05-24 | 排序:Trending(月榜)

排行表 Top 20

# 模型 任务 参数量 下载量 推理 亮点
1 bytedance-research/Lance 多模态(Any-to-Any) 1.47k 字节跳动多模态全能模型,支持任意到任意模态转换
2 tencent/Hy-MT2-1.8B 翻译 2B 4.53k 腾讯翻译模型,轻量级多语言翻译
3 Supertone/supertonic-3 文本转语音 43.1k 韩国 Supertone 语音合成模型,高质量 TTS
4 tencent/Hy-MT2-30B-A3B 翻译 30B 1.24k 腾讯大参数翻译模型,MoE 架构激活参数 3B
5 NemoStation/Marlin-2B 视频转文本 2B 6.03k 轻量视频理解模型,专注视频内容分析
6 sapientinc/HRM-Text-1B 文本生成 1B 84.3k 极轻量文本生成模型,适合边缘部署
7 openbmb/MiniCPM-V-4.6 图文理解 270k 面壁智能多模态模型 MiniCPM-V 最新版本
8 SulphurAI/Sulphur-2-base 文本转视频 9B 1.33M 文本生成视频模型,下载量破百万
9 unsloth/Qwen3.6-27B-MTP-GGUF 图文理解 27B 660k Qwen3.6-27B 的 GGUF 量化版,支持本地推理
10 CohereLabs/command-a-plus-05-2026-w4a4 图文理解 126B 5.63k Cohere 最新命令模型,4bit 量化版
11 unsloth/Qwen3.6-35B-A3B-MTP-GGUF 图文理解 36B 548k Qwen3.6 MoE 模型 GGUF 量化版,高效推理
12 circlestone-labs/Anima 637k 高人气社区模型,下载量超 63 万
13 Jackrong/Qwopus3.5-9B-Coder-GGUF 图文理解 9B 38.9k 基于 Qwen 的编程优化 GGUF 量化模型
14 deepseek-ai/DeepSeek-V4-Pro 文本生成 862B 4.67M DeepSeek V4 旗舰模型,467 万下载量霸榜
15 tencent/Hy-MT2-7B 翻译 8B 2.41k 腾讯中等规模翻译模型,平衡性能与效率
16 ResembleAI/Dramabox 文本转语音 1.45k ResembleAI 语音合成模型,面向创意内容
17 CohereLabs/command-a-plus-05-2026-bf16 图文理解 219B 12.4k Cohere 最大规模命令模型,bf16 精度全量版
18 numind/NuExtract3 图像转文本 5B 11k 文档信息提取专用模型,第三代
19 Jackrong/Qwopus3.6-27B-v2-GGUF 图文理解 27B 8.3k Qwen3.6-27B 社区优化版 GGUF 量化
20 TencentARC/Pixal3D 图像转3D 腾讯 ARC 单图生成 3D 模型

核心洞察

  1. 国产模型强势崛起:Top 20 中中国团队贡献了 10 个模型(字节跳动、腾讯×4、面壁智能、DeepSeek×2、美团、腾讯 ARC),占据半壁江山。DeepSeek-V4-Pro 以 862B 参数、467 万下载量稳居榜首级别。
  2. GGUF 量化成主流部署方式:unsloth 的 Qwen3.6 GGUF 量化版占据多个席位,社区对本地可运行模型需求旺盛,Qwen3.6 系列成量化热门。
  3. 多模态与垂直领域并重:图文理解是最热门任务类型,同时翻译(腾讯 Hy-MT2 系列三款上榜)、语音合成(TTS)、视频生成等垂直领域均有突破。
  4. 轻量模型与超大模型两极化:从 1B 的 HRM-Text 到 862B 的 DeepSeek-V4-Pro,趋势呈现明显的两极分化——要么追求极致轻量可本地运行,要么追求极致性能靠云端推理。

📝 Hugging Face Papers

数据采集时间:2026-05-24 | 来源:huggingface.co/papers/month/2026-05

月榜 Top 20

# 论文标题 👍 方向 作者/机构 GitHub ⭐ 亮点
1 MolmoAct2: Action Reasoning Models for Real-world Deployment(面向真实部署的动作推理模型) 335 具身智能 / Agent Ai2(艾伦人工智能研究所) 530 Ai2 推出面向真实世界部署的动作推理模型,结合视觉理解与操作执行
2 CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence(可信文档智能的证据归因基准) 263 文档理解 / NLP OpenDataLab(上海人工智能实验室开放数据团队) 66 首个面向文档智能证据归因的评测基准,推动可信 AI
3 Heterogeneous Scientific Foundation Model Collaboration(异构科学基础模型协作) 218 科学计算 / 基础模型 UIUC(伊利诺伊大学香槟分校) 22 探索不同科学领域基础模型之间的异构协作范式
4 MinT: Managed Infrastructure for Training and Serving Millions of LLMs(面向百万级 LLM 训练与推理的托管基础设施) 217 LLM 基础设施 Mind Lab 37 大规模 LLM 训练和服务的基础设施方案,支持百万级模型管理
5 Mean Mode Screaming: Mean-Variance Split Residuals for 1000-Layer Diffusion Transformers(面向千层扩散 Transformer 的均值-方差分裂残差) 215 扩散模型 / 架构创新 StableKirito(独立研究者) 9 突破性工作:成功训练 1000 层扩散 Transformer,残差连接新范式
6 Code as Agent Harness(以代码驱动的 Agent 框架) 199 AI Agent / 代码智能 42 人团队 214 将代码作为 Agent 核心驱动力的全新框架设计
7 DelTA: Discriminative Token Credit Assignment for RL from Verifiable Rewards(面向可验证奖励 RL 的判别式 Token 信用分配) 191 强化学习 / RLHF Yankai Lin, Wei Wu 等 5 改进 RLHF 中 Token 级别的信用分配机制,提升奖励信号精度
8 Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information(基于点互信息的推理 RL 反自蒸馏) 189 强化学习 / 推理 rednote-hilab(小红书) 11 小红书提出反自蒸馏策略,缓解推理模型 RL 训练中的退化问题
9 SenseNova-U1: Unifying Multimodal Understanding and Generation with NEO-unify Architecture(统一多模态理解与生成的 NEO-unify 架构) 185 多模态 / 统一模型 SenseNova(商汤科技) 2.29k 商汤推出统一多模态模型,同时支持理解和生成任务
10 TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation(面向无地图公交路线生成的大规模数据集与基准) 167 NLP / 交通 AI AMAP-ML(高德地图) 112 高德地图发布公交路线生成数据集,将 LLM 应用于交通规划
11 [arXiv:2604.27660] 162 待分类 Qingyi Wang, Yu Lei 等 13 人 223 多作者团队合作,热度极高的研究
12 [arXiv:2605.22109] 160 待分类 University of Tokyo(东京大学) 9 东京大学团队前沿研究
13 Achieving Gold-Medal-Level Olympiad Reasoning via Simple and Unified Scaling(通过简单统一扩展达到奥赛金牌级推理) 156 数学推理 / 缩放定律 ych133 等 28 人 86 展示简单统一扩展即可达到数学奥林匹克金牌水平的推理能力
14 [arXiv:2605.20025] 151 待分类 Bingzhou Li, Mairui Li 等 35 人 12.6k 超大团队合作,GitHub 热度极高(12.6k Stars)
15 When Vision Speaks for Sound(当视觉为声音代言) 145 音视觉 / 跨模态 UC Davis(加州大学戴维斯分校) 36 探索视觉信息辅助音频理解与生成的跨模态新方法
16 [arXiv:2605.09530] 145 待分类 MemTensor 94 MemTensor 团队高热度研究
17 [arXiv:2605.14747] 142 待分类 Peking University(北京大学) 26 北大团队研究成果
18 PhysBrain 1.0 Technical Report(物理大脑 1.0 技术报告) 140 科学 AI / 物理 DeepCybo 24 面向物理科学的专用 AI 模型技术报告
19 [arXiv:2605.10616] 138 待分类 Technion(以色列理工学院) 3 以色列理工学院前沿研究
20 Mega-ASR: Towards In-the-wild² Speech Recognition via Scaling up Real-world Acoustic Simulation(面向真实世界²语音识别的大规模声学仿真) 126 语音识别 / ASR NUS(新加坡国立大学) 398 通过大规模真实声学仿真提升语音识别在复杂环境中的鲁棒性

月榜 21-50(精选)

# 论文标题 👍 方向 作者/机构 GitHub ⭐ 亮点
23 RLDX-1 Technical Report(RLDX-1 技术报告) 122 强化学习 RLWRLD 225 RLWRLD 团队发布的强化学习技术报告
29 LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation(面向长视频生成的 NVFP4 并行基础设施) 108 视频生成 / 基础设施 NVIDIA(英伟达) 1.82k 英伟达推出 NVFP4 精度长视频生成并行训练与推理框架
30 Self-Distilled Agentic Reinforcement Learning(自蒸馏 Agent 强化学习) 108 强化学习 / Agent Jinyang Wu 等 11 人 133 将自蒸馏引入 Agent 强化学习,提升训练效率
31 Qwen-Image-2.0 Technical Report(通义千问图像 2.0 技术报告) 106 多模态 / 图像生成 Qwen(通义千问/阿里) 8 阿里通义千问发布图像生成 2.0 版本技术报告
40 Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos(增强免训练无限帧长视频一致性生成) 88 视频生成 alibaba-inc(阿里巴巴) 1 阿里巴巴提出免训练的长视频一致性生成方案
41 Training Long-Context Vision-Language Models Effectively with Generalization Beyond 128K Context(有效训练 128K 以上长上下文视觉语言模型) 85 多模态 / 长上下文 ByteDance Seed(字节跳动种子团队) 2 字节跳动实现 128K+ 长上下文视觉语言模型训练
48 Continuous Latent Diffusion Language Model(连续潜空间扩散语言模型) 78 语言模型 / 扩散 ByteDance Seed(字节跳动种子团队) 160 字节跳动将扩散模型应用于语言建模的新范式

核心洞察

  1. 机构分布:中国团队占半壁江山:商汤 SenseNova、阿里 Qwen、腾讯混元、字节跳动 Seed、小红书、高德、北大、清华、上交、浙大、中科院等中国机构约占 50%+。NVIDIA 依然是论文数量最多的单一海外机构。

  2. 研究方向热度排行

排名 方向 代表论文数 说明
1 多模态理解与生成 8+ 统一理解+生成架构成为主流(SenseNova-U1、Qwen-Image-2.0、Lance)
2 强化学习 / RLHF / 推理 7+ RL 训练优化、奖励信号、推理能力提升持续火热(DelTA、Anti-SD、Olympiad)
3 AI Agent / 具身智能 4+ 动作推理、代码驱动 Agent 成为新热点(MolmoAct2、Code as Agent)
4 视频生成 3+ 长视频、高质量视频生成需求爆发(LongLive-2.0、SANA-Video)
5 LLM 基础设施 / 训练优化 3+ 大规模训练和服务基础设施受关注(MinT、RoundPipe、NVFP4)
  1. 趋势总结
    • 统一多模态模型成为共识:理解+生成+编辑一体化,各巨头同步推进
    • RL 训练方法论密集突破:多篇论文聚焦 RLHF/GRPO 训练优化
    • Agent 从对话走向行动:MolmoAct2、Code as Agent 标志着 Agent 从文本对话升级为真实世界操作
    • 中国研究力量全面崛起:从基础设施到模型创新,中国机构在几乎所有热门方向都有重量级产出

💬 Hacker News

周榜 AI 热帖排行

数据来源:Hacker News Algolia API | 采集时间:2026-05-24

🏆 Tier 1 — 超级爆款(200+ points)

热度 标题 类型 评论 亮点
715 Qwen3.7-Max: The Agent Frontier(Qwen3.7-Max:Agent 前沿) 新闻/讨论 292 🔥 超高热度,广泛传播
676 Forge – Guardrails take an 8B model from 53% to 99% on agentic tasks(Forge — 防护栏让 8B 模型在 agent 任务上从 53% 提升到 99%) Show HN 250 🔥 超高热度,广泛传播
372 We let AIs run radio stations(我们让 AI 运营广播电台) 新闻/讨论 271 🔥 热度+讨论双高
332 OpenAI Adopts Google’s SynthID Watermark for AI Images with Verification Tool(OpenAI 采用 Google 的 SynthID 水印技术用于 AI 图像验证) 新闻/讨论 180 🔥 高热度,值得关注
224 Microsoft reports AI is more expensive than paying human employees(微软报告 AI 比雇佣人类员工更贵) 新闻/讨论 65 🔥 高热度,值得关注

🥇 Tier 2 — 高热度(100-200 points)

热度 标题 类型 评论 亮点
154 Models.dev: open-source database of AI model specs, pricing, and capabilities(Models.dev — AI 模型规格、定价和能力的开源数据库) 新闻/讨论 27 🔓 开源项目
144 Formal Verification Gates for AI Coding Loops(AI 编程循环的形式化验证门控) 新闻/讨论 32 📌 值得关注
142 AI is too expensive(AI 太贵了) 新闻/讨论 152 💬 高讨论度
119 I’m tired of AI-generated answers(我厌倦了 AI 生成的答案) Tell HN 56 💬 社区讨论
100 Runtime (YC P26) – Sandboxed coding agents for everyone on a team(Runtime — 面向团队所有人的沙箱化编程 agent) Launch HN 30 🚀 YC 项目发布

🥈 Tier 3 — 中等热度(40-100 points)

热度 标题 类型 评论 亮点
95 Testing distributed systems with AI agents(用 AI agent 测试分布式系统) 新闻/讨论 22 📌 值得关注
94 Agent.email – sign up via curl, claim with a human OTP(Agent.email — 通过 curl 注册,用人类 OTP 认领) Show HN 105 🆕 社区首发项目
62 InsForge – Open-source Heroku for coding agents(InsForge — 面向编程 agent 的开源 Heroku) Show HN 7 🆕 社区首发项目
57 Alternatives to HN for “tech outside of AI” discussion?(HN 之外有讨论「AI 以外的技术」的地方吗?) 新闻/讨论 35 📌 值得关注
41 Id-agent – Token efficient UUID alternative for AI agents(Id-agent — AI agent 的 token 高效 UUID 替代方案) Show HN 55 🆕 社区首发项目

周榜核心信号

  1. Qwen3.7-Max 引领 Agent 浪潮:715 分高居周榜榜首,通义千问最新模型聚焦 Agent 能力,中国开源 AI 模型的 Agent 方向成为焦点
  2. 小模型+护栏 = 强 Agent:Forge 项目(676分)证明 8B 小模型配合护栏机制可从 53% 跃升至 99%,暗示「小而精」可能比「大而全」更实用
  3. AI 成本焦虑爆发:「微软报告 AI 比人类更贵」(224分)、「AI 太贵了」(142分)——ROI 质疑声浪正在上升,AI 泡沫讨论升温
  4. 编程 Agent 基础设施化:Runtime(100分)、InsForge(62分)等为编程 Agent 构建沙箱、部署等基础设施,Agent 开发正在从玩具走向生产级
  5. 社区对 AI 疲劳感显现:「厌倦 AI 生成的答案」(119分)、「HN 之外有讨论非 AI 技术的地方吗」(57分)——HN 社区对 AI 信息过载的抵触情绪明显上升

月榜 AI 热帖排行(精选)

数据来源:Hacker News Algolia API | 采集时间:2026-05-24

🏆 月榜 Tier 1 — 超级爆款(400+ points)

热度 标题 类型 评论 亮点
2346 An AI agent published a hit piece on me(一个 AI agent 发了一篇攻击我的文章) 新闻/讨论 951 🔥 超高热度+激烈讨论,社区核心话题
1274 OpenCode – Open source AI coding agent(OpenCode — 开源 AI 编程 agent) 新闻/讨论 619 🔥 超高热度+激烈讨论
953 AI agent opens a PR write a blogpost to shames the maintainer who closes it(AI agent 提交 PR 并写博文羞辱关闭它的维护者) 新闻/讨论 750 🔥 超高热度+激烈讨论
912 Adobe’s new image rotation tool is one of the most impressive AI tools seen(Adobe 新图像旋转工具是最令人印象深刻的 AI 工具之一) 新闻/讨论 268 🔥 超高热度
879 Opus 4.5 is not the normal AI agent experience that I have had thus far(Opus 4.5 不是我迄今为止的正常 AI agent 体验) 新闻/讨论 1353 🔥 超高热度+激烈讨论
860 An AI agent deleted our production database. The agent’s confession is below(AI agent 删除了我们的生产数据库。agent 的自白如下) 新闻/讨论 1032 🔥 超高热度+激烈讨论
821 Reverse engineering a $1B Legal AI tool exposed 100k+ confidential files(逆向工程一个十亿美元法律 AI 工具,暴露了超过 10 万份机密文件) 新闻/讨论 288 🔥 超高热度
729 AI tooling must be disclosed for contributions(贡献代码必须披露 AI 工具使用情况) 新闻/讨论 464 🔥 超高热度
703 Windows 11 adds AI agent that runs in background with access to personal folders(Windows 11 添加后台运行的 AI agent,可访问个人文件夹) 新闻/讨论 638 🔥 超高热度+激烈讨论
611 Ex-GitHub CEO launches a new developer platform for AI agents(前 GitHub CEO 推出面向 AI agent 的新开发者平台) 新闻/讨论 577 🔥 超高热度
601 AI tools are spotting errors in research papers(AI 工具正在发现研究论文中的错误) 新闻/讨论 215 🔥 超高热度
588 Exploiting the most prominent AI agent benchmarks(利用最知名的 AI agent 基准测试漏洞) 新闻/讨论 143 🔥 超高热度
577 AI Blindspots – Blindspots in LLMs I’ve noticed while AI coding(AI 盲区 — 我在 AI 编程中注意到的 LLM 盲点) 新闻/讨论 240 🔥 超高热度
543 Building Effective AI Agents(构建高效的 AI Agent) 新闻/讨论 88 🔥 超高热度
480 Why we no longer use LangChain for building our AI agents(为什么我们不再使用 LangChain 构建 AI agent) 新闻/讨论 297 🔥 热度+讨论双高
455 A real time AI video agent with under 1 second of latency(实时 AI 视频 agent,延迟不到 1 秒) Show HN 256 🔥 热度+讨论双高
423 AI agents: Less capability, more reliability, please(AI agents:请少一点能力,多一点可靠性) 新闻/讨论 253 🔥 热度+讨论双高
412 AI agents are starting to eat SaaS(AI agents 开始吞噬 SaaS) 新闻/讨论 386 🔥 热度+讨论双高

月榜核心信号

  1. AI Agent 安全事故频发:月榜 Top 1「AI agent 发攻击文章」(2346分)、Top 3「AI agent 提 PR 羞辱维护者」(953分)、Top 6「AI agent 删生产数据库」(860分)——Agent 失控问题引发巨大关注,安全性成为社区头号议题
  2. AI 编程 Agent 生态爆发:OpenCode(1274分)、Crush(367分)、Opencode(319分)等开源方案集中涌现,AI 编程助手赛道竞争白热化
  3. Agent 可靠性 vs 能力之争:「AI agents:请少一点能力,多一点可靠性」(423分)、「不要信任 AI agents」(344分)——社区正在反思 Agent 能力边界的必要性
  4. 开源 AI 模型持续民主化:从 Mistral 泄漏模型到 Qwen OCR 再到 Apple OpenELM,开源模型在多领域追赶闭源水平
  5. AI 工具的双面性:AI 工具能发现研究论文错误(601分)、降低医院死亡率(230分),但也引发 Amazon 员工「tokenmaxxing」(251分)——AI 工具正在深刻改变各行各业的工作方式

🔬 Reddit r/MachineLearning

月榜 Top 15

数据采集时间:2026-05-24

# Flair 标题 分数 评论数 作者
1 [N] 新闻 arXiv implements 1-year ban for papers containing incontrovertible evidence of unchecked LLM-generated errors(arXiv 对包含未经核查的 LLM 生成错误的论文实施 1 年禁令) 669 76 u/Nunki08
2 [D] 讨论 Backlash against Arxiv’s proposed 1 year ban is genuinely perplexing(对 arXiv 提议 1 年禁令的强烈反对令人费解) 572 164 u/NeighborhoodFatCat
3 [R] 研究 Reviving PapersWithCode by Hugging Face(Hugging Face 复活 PapersWithCode 项目) 349 33 u/NielsRogge
4 [P] 项目 An interactive semantic map of the latest 10 million published papers(最新 1000 万篇已发表论文的交互式语义地图) 286 31 u/icannotchangethename
5 [R] 研究 There Will Be a Scientific Theory of Deep Learning(深度学习终将拥有科学理论) 255 53 u/dot—
6 [D] 讨论 Program misleading high school students into paying to perform academic misconduct in ML Research(项目误导高中生付费参与 ML 研究学术不端行为) 257 38 u/Marisu_BG
7 [D] 讨论 Slop is making me feel disconnected from AI Research(AI 研究中的低质内容让我感到与领域脱节) 230 80 u/Skye7821
8 [D] 讨论 Stop letting LLMs edit your .bib(别再让 LLM 编辑你的参考文献文件了) 191 35 u/Pure-Ad9079
9 [D] 讨论 Why isn’t LLM reasoning done in vector space instead of natural language?(为什么 LLM 推理不在向量空间中而在自然语言中进行?) 186 71 u/ZeusZCC
10 [R] 研究 Chinese nexus/network in A* conferences rejecting non-Chinese papers(A* 会议中的中国关系网拒绝非中国论文) 169 50 u/AppropriatePush6262
11 [R] 研究 Is it just me or is the Conference Lottery culture killing research?(会议抽签文化是否正在扼杀研究?) 165 41 u/SillyNeuron
12 [D] 讨论 Are modern ML PhDs becoming too incremental?(现代 ML 博士研究是否过于渐进式创新?) 165 55 u/Hope999991
13 [P] 项目 Visualizing Loss Landscapes of Neural Networks(神经网络损失地貌可视化) 163 13 u/Hackerstreak
14 [D] 讨论 PhD students in ML, how many hours on average do you work?(ML 博士生平均每周工作多少小时?) 161 69 u/akardashian
15 [D] 讨论 Human-level performance via ML was not proven impossible with complexity theory(复杂性理论并未证明 ML 无法达到人类水平) 148 52 u/mike_uoftdcs

月榜核心洞察

  1. 学术诚信危机成为月度最大焦点:arXiv 的 LLM 论文禁令引发了社区最激烈的讨论,折射出 AI 生成内容对学术出版生态的严重冲击。社区共识倾向于更严格的审核机制。
  2. LLM 在科研中的角色引发广泛反思:从”别让 LLM 编辑参考文献”到”为什么推理不在向量空间进行”,多帖讨论 LLM 的合理使用边界和根本技术局限。
  3. 开源工具与学术基础设施持续进化:PapersWithCode 被 Hugging Face 复活、1000 万论文语义地图等工具类项目获得高关注。
  4. 学术公平性与同行评审争议升温:A* 会议审稿公平性、会议抽签文化、PhD 增量创新等讨论,反映出 ML 学术生态的深层结构性焦虑。

周榜 Top 15

数据采集时间:2026-05-24

# Flair 标题 分数 评论数 作者
1 [R] 研究 Reviving PapersWithCode by Hugging Face(Hugging Face 复活 PapersWithCode 项目) 351 33 u/NielsRogge
2 [D] 讨论 Slop is making me feel disconnected from AI Research(AI 研究中的低质内容让我感到与领域脱节) 233 80 u/Skye7821
3 [D] 讨论 OpenAI claims a general-purpose reasoning model found a counterexample to Erdős’s unit-distance bound(OpenAI 声称通用推理模型找到了 Erdős 单位距离界的反例) 111 37 u/NutInBobby
4 [P] 项目 Sub-JEPA: a simple fix to LeCun group’s LeWorldModel(Sub-JEPA:对 LeCun 团队 LeWorldModel 的简单改进) 97 20 u/kai-zhao
5 [R] 研究 A Simple Solution to Improve Broken Peer Review System at AI Conferences(改进 AI 会议同行评审系统的一个简单方案) 65 23 u/isentropiccombustor
6 [D] 讨论 How competitive are PhD admissions currently(目前博士录取竞争有多激烈) 66 48 u/strammerrammer
7 [R] 研究 Machine Learning on Spherical Manifold(球面流形上的机器学习) 50 23 u/eesuck0
8 [D] 讨论 What do you think about Tabular Foundation Models(你怎么看表格数据基础模型) 46 30 u/pplonski
9 [D] 讨论 Do VLMs in production still use fixed-patch ViTs?(生产环境中的视觉语言模型是否仍在使用固定 patch 的 ViT?) 42 18 u/howtorewriteaname
10 [P] 项目 Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention(LLM 架构最新进展:KV 共享、多头注意力压缩) 42 1 u/seraschka
11 [D] 讨论 Vision-capable LLMs vs. OCR for long-document QA(视觉 LLM vs OCR 用于长文档问答) 41 2 u/Uiqueblhats
12 [P] 项目 NuExtract3: open-weight 4B VLM for Markdown, OCR and structured extraction(NuExtract3:开源 4B 视觉语言模型,支持 Markdown、OCR 和结构化提取) 34 7 u/Gailenstorm
13 [R] 研究 Novel Problems in VLA(视觉-语言-动作模型中的新问题) 30 21 u/No_Mixture5766
14 [N] 新闻 How to get rejected by IEEE T-PAMI with ‘Excellent’ scores?(如何在 IEEE T-PAMI 拿到”优秀”评分却仍被拒稿) 29 11 u/cussealin
15 [R] 研究 COLM 2026 Reviews Discussion(COLM 2026 审稿讨论) 28 13 u/RandomMan0880

周榜核心洞察

  1. 低质 AI 生成内容(Slop)引发学术社区焦虑:本周延续月度趋势,多篇讨论反映研究者对 AI 生成论文泛滥的严重担忧。
  2. VLM 与多模态技术快速演进:视觉语言模型从架构优化到应用落地占据多个席位,NuExtract3 等开源工具加速了文档理解的民主化进程。
  3. LLM 推理能力突破性进展:OpenAI 声称推理模型解决了数学难题的反例,引发关于 AI 推理能力边界的广泛讨论。
  4. LeCun 世界模型路线获改进验证:Sub-JEPA 对 LeWorldModel 的改进获得关注,自监督学习与世界模型方向仍在活跃迭代中。

🚀 Product Hunt

月榜 Top 17

数据来源:Product Hunt Monthly Leaderboard (2026/05) | 采集时间:2026-05-24

# 产品 👍 💬 标签 说明
1 Kilo Code v7 for VS Code 207 781 开源 · 软件工程 · 开发者工具 支持并行 Agent、Diff 审查和多模型对比的 VS Code 编码插件
2 StoreClaw 284 719 人工智能 · 电子商务 · 营销自动化 用懂销售的 AI Agent 帮你提升店铺利润
3 PollyReach 194 685 效率工具 · 人工智能 · 虚拟助手 为 AI Agent 提供真实电话号码和语音通话能力
4 RankSpot 103 660 市场营销 · SEO 基于深度竞品分析的 AI SEO 博客生成工具
5 OpenHuman 73 641 效率工具 · 开源 · 人工智能 以人为中心的开源 AI 框架
6 Velo 2.0 94 626 效率工具 · 销售 · 视频 将语音和屏幕即时转为可分享的视频
7 Spellar 3.0 117 570 效率工具 · 会议 · 人工智能 具备跨会议记忆的 AI 会议助手
8 Postiz 57 560 社交媒体 · 营销自动化 · 社交媒体营销 面向 Agent(如 OpenClaw)的智能社交媒体排程工具
9 Naptick AI 123 552 健康健身 · 硬件 · 人工智能 AI 睡眠助手,帮助用户轻松入睡
10 Shadow 2.0 176 548 效率工具 · 会议 在会议结束前就自动完成会议产生的所有工作
11 SocLeads 3.0 88 534 邮件 · 社交媒体 · 市场营销 按地理位置从社交平台和地图抓取邮箱
12 articuler.ai 88 530 社交网络 · 职业发展 · 社区 描述你的目标,匹配到合适的专业人士
13 Kelviq 96 529 支付 · SaaS · 开发者工具 面向 SaaS 和 AI 公司的支付、税务和账单解决方案
14 mailX by mailwarm 271 522 邮件 · 邮件营销 · 人工智能 面向人类和 AI Agent 的邮件送达率工具包(YC S20)
15 Fere AI 62 519 金融科技 · 人工智能 · Web3 将信号转化为加密货币和 Polymarket 交易的 AI Agent
16 Kanwas 228 511 效率工具 · 人工智能 开源的团队知识大脑
17 Vivago Video Agent 74 506 效率工具 · 市场营销 · 人工智能 无需提示词,自动生成高质量视频内容

月榜独家发现

  1. AI Agent 生态爆发:本月榜单中超过 60% 的产品围绕 AI Agent 展开——从编码、销售、电话、邮件到社交媒体,Agent 正在渗透每个工作环节。闭源 SaaS 产品如 StoreClaw、PollyReach、RankSpot 在其他开源/技术数据源中几乎不可见,是 Product Hunt 独有的信号。
  2. “Agent 化 SaaS”成为新范式:传统 SaaS 品类正在被重新包装为 “Agent-native”——mailX 专门服务 AI Agent 的邮件送达、Postiz 面向 Agent 的社交排程、PollyReach 让 Agent 拥有电话号码。

周榜 Top 17

数据来源:Product Hunt Weekly Leaderboard (2026/21) | 采集时间:2026-05-24

# 产品 👍 💬 标签 说明
1 StoreClaw 284 719 人工智能 · 电子商务 · 营销自动化 用懂销售的 AI Agent 帮你提升店铺利润
2 PollyReach 194 685 效率工具 · 人工智能 · 虚拟助手 为 AI Agent 提供真实电话号码和语音通话能力
3 SocLeads 3.0 88 534 邮件 · 社交媒体 · 市场营销 按地理位置从社交平台和地图抓取邮箱
4 mailX by mailwarm 271 522 邮件 · 邮件营销 · 人工智能 面向人类和 AI Agent 的邮件送达率工具包(YC S20)
5 LobeHub 88 494 效率工具 · 人工智能 多 Agent 协作的首席 Agent 调度平台
6 Tycoon AI 113 490 市场营销 · 人工智能 · 科技 用 AI Agent 完全运营一人公司
7 TestSprite 3.0 78 431 开发者工具 · 人工智能 并行 Agent 集群在数分钟内完成应用测试
8 Composer 2.5 12 419 人工智能 · 开发 Cursor 迄今最强大的模型版本
9 Emdash 90 400 效率工具 · 开源 · 开发者工具 一个应用整合所有编码 Agent,开源
10 Drizz 63 400 开发者工具 · 人工智能 · 无代码 自动编写、运行和修复的移动端自动化测试
11 Gemini Omni 8 375 人工智能 · 视频 从任意输入(以视频开始)创建任何内容
12 Cleo 69 356 效率工具 · 人工智能 管理整个团队的 AI 产品经理
13 Mantle Chat 43 354 效率工具 · 消息通讯 团队与 AI 协作共事的聊天平台
14 Mintlify Workflows 40 323 笔记 · 开发者工具 · 人工智能 自动更新的知识库平台
15 General Compute 34 310 API · 软件工程 为速度优化的推理云上运行的 AI 模型
16 Runtime 79 282 Slack · 开发者工具 · 人工智能 为团队每个成员提供沙箱化编码 Agent
17 Google Antigravity 2.0 20 281 任务管理 · 开发者工具 · 人工智能 从桌面应用编排多 Agent 工作流

周榜独家发现

  1. Cursor Composer 2.5 本周重磅发布:尽管 upvotes 仅有 12,但评论数高达 419,社区讨论极为热烈。这是一个典型的「低票高评论」产品。
  2. 多 Agent 编排平台集中涌现:LobeHub(多 Agent 调度)、Emdash(统一编码 Agent)、Google Antigravity 2.0(多 Agent 工作流编排)、Runtime(沙箱编码 Agent)——同一周内出现 4+ 个 Agent 编排类产品。
  3. AI Agent 渗透垂直行业加速:本周 Top 17 中超过 70% 与 AI Agent 直接相关,覆盖销售、通讯、测试、开发等多个垂直领域。

📰 Techmeme

本周 AI 行业新闻 Top 15

过去 7 天 AI 相关行业新闻精选(2026-05-18 ~ 2026-05-24)
来源:TechCrunch / The Verge / Bloomberg / Reuters / NYT 等

# 标题 来源 说明
1 OpenAI 一季度营收约 57 亿美元,领先 Anthropic 约 10 亿;ChatGPT 用户增长停滞 The Information OpenAI 收入高速增长但运营亏损率仍达 -122%,用户增长出现瓶颈信号
2 AI 大神 Karpathy 加入 Anthropic @karpathy 前特斯拉 AI 总监、OpenAI 创始成员 Karpathy 宣布加入 Anthropic 回归研发
3 英伟达一季度营收同比大涨 85% 至 816 亿美元,数据中心收入增长 92% Nvidia Newsroom / Bloomberg AI 基础设施需求持续爆发,英伟达同时宣布 800 亿美元股票回购计划
4 DeepSeek 将旗舰模型 V4 Pro API 降价 75% 永久化 Bloomberg 输入 $0.435/百万 token、输出 $0.87/百万 token,AI 大模型价格战进一步加剧
5 白宫批准 90 亿美元 AI 芯片采购;Anthropic 与 NSA 敲定机密合同 New York Times 美国情报机构大规模部署 AI 能力,Anthropic 进入国家安全领域
6 Zoom 持有 Anthropic 股份价值约 12.7 亿美元(Anthropic 估值 3800 亿) Bloomberg Anthropic 估值达 3800 亿美元,Zoom 因早期投资获得超 10 亿美元账面回报
7 OpenAI 内部推理模型推翻了 1946 年提出的 Erdős 单位距离猜想 OpenAI AI 在数学研究上取得重大突破,首次由 AI 模型解决长期未解的离散几何核心问题
8 OpenAI 支持 Google SynthID 水印,将上线公开验证门户 The Verge 行业协力推进 AI 生成内容可追溯性
9 中国 AI 创业公司一季度融资 162 亿美元,同比增长 185% South China Morning Post Moonshot、Z.ai、MiniMax 等头部公司领跑
10 DeepSeek 创始人宣布 AGI 目标,100 亿美元融资推进中 Bloomberg DeepSeek 直指 AGI,优先突破性研究而非短期商业化
11 Google 预告 Android Halo,让 AI 代理状态在手机顶部可视化 9to5Google Android 将引入 AI Agent 交互界面新范式
12 Anthropic Claude Mythos 预览版已发现超 1 万个高危安全漏洞 Anthropic Project Glasswing 成果显著,AI 安全审计能力远超传统工具
13 纳德拉重组微软高管团队以应对 AI 竞赛 Business Insider 微软推行创业公司式运营模式,全面提速 AI 战略
14 AI 推理云平台 Modal Labs C 轮融资 3.55 亿美元,估值 46.5 亿 Reuters 无服务器 AI 推理基础设施赛道估值暴涨
15 Salesforce Agentforce 宣传视频展示尚不可用的功能 Bloomberg AI Agent 产品落地与宣传差距引发关注

行业核心动态

大公司动向

  • OpenAI 营收飙升但亏损加剧:一季度收入 57 亿美元,领先 Anthropic 约 10 亿,但运营亏损率仍高达 -122%,ChatGPT 用户增长出现停滞迹象。同时其内部推理模型在数学领域取得里程碑式突破。
  • Anthropic 生态加速扩张:Karpathy 加盟、Zoom 持股价值超 12 亿、Claude Mythos 安全审计成果亮眼、正与 NSA 敲定机密合同,公司估值已达 3800 亿美元。
  • 英伟达继续狂飙:一季度营收 816 亿美元,同比增长 85%,数据中心收入增长 92%,宣布 800 亿美元回购。Dell 透露其 AI Factory 已有 5000 家客户。
  • Google AI 多线推进:Android Halo(AI Agent 可视化)、CodeMender(代码安全 Agent)、AI Mode 广告新格式、Google Docs Live(AI 语音起草文档)等密集发布。
  • 微软组织变革:纳德拉重组高管团队,推行创业公司式运营模式。

AI 价格战与融资热潮

  • DeepSeek 永久降价 75%:V4 Pro API 价格降至输入 $0.435/百万 token,同时推进 100 亿美元融资。
  • 中国 AI 融资爆发:Q1 融资 162 亿美元,同比增长 185%。
  • Modal Labs 估值 4 个月翻 4 倍:从 11 亿飙升至 46.5 亿美元。

政策法规与伦理

  • 白宫 AI 行政令草案曝光,强调政府 AI 审查自愿原则
  • 加州州长签署 EO,要求研究对不使用 AI 替代工人的企业提供补贴
  • NTSB 暂停事故数据库访问,因有人用 AI 复原坠机身故飞行员的声音
  • Airbnb 被国会调查使用中国 AI 模型

📈 Trendshift

日榜 — AI 相关 Top 10

采集时间:2026-05-24 | 数据来源:trendshift.io(日榜)

# 项目 📈 今日增长 ⭐ 总星 主题
1 multica-ai/andrej-karpathy-skills +1.7k 1.7k AI 编码技能
2 colbymchenry/codegraph +1.6k 1.6k AI 编码助手
3 Lum1104/Understand-Anything +1.2k 1.2k AI 编码助手、知识图谱
4 anthropics/claude-plugins-official +930 930 Claude Code 官方插件
5 rohitg00/ai-engineering-from-scratch +894 894 AI 智能体、编程教程
6 obra/superpowers +593 593 AI 智能体框架、AI 编码助手
7 farion1231/cc-switch +472 472 AI 编码助手、MCP
8 ruvnet/RuView +434 434 空间智能、WiFi 感知
9 safishamsi/graphify +382 382 AI 智能体、知识图谱技能
10 manaflow-ai/cmux +358 358 AI 智能体、AI 编码终端

日榜核心洞察

  1. Claude Code 生态爆发:日榜前 10 中有 5 个项目直接与 Claude Code 相关,显示 Anthropic 的 AI 编码生态正在快速聚集开发者关注。
  2. “知识图谱 + AI 编码”成为新范式:Understand-Anything 和 graphify 均聚焦于将代码/文档转化为可查询的知识图谱,为 AI 编码助手提供结构化上下文。

周榜 — AI 相关 Top 10

采集时间:2026-05-24 | 数据来源:trendshift.io/weekly

# 项目 📈 周增长 ⭐ 总星 主题
1 NousResearch/hermes-agent +2.1k 8.7k AI 智能体、AI 技能
2 multica-ai/andrej-karpathy-skills +1.4k 13.2k AI 编码技能
3 tinyhumansai/openhuman +1.3k 12.8k AI 超级智能
4 mattpocock/skills +1.2k 12.4k AI 技能
5 obra/superpowers +760 8k AI 智能体框架、AI 编码助手
6 msitarzewski/agency-agents +726 5.3k AI 智能体
7 ruvnet/RuView +750 5k 空间智能、WiFi 感知
8 colbymchenry/codegraph +656 13.4k AI 编码助手
9 rohitg00/ai-engineering-from-scratch +639 4.1k AI 智能体、编程教程
10 Imbad0202/academic-research-skills +608 9.8k AI 智能体、学术研究工作流

周榜核心洞察

  1. AI 智能体(Agent)霸榜:周榜前 10 全部是 AI 相关项目,其中 7 个明确标注为 “AI agent”。NousResearch/hermes-agent 以 +2.1k/周的增长率位居第一,体现了 AI Agent 从单次任务向长期协作模式的演进。
  2. “AI 技能包”赛道成形:andrej-karpathy-skills、mattpocock/skills 和 academic-research-skills 三个项目均以 CLAUDE.md / skills 文件为核心产品,说明”为 AI 编码助手提供结构化技能指令”已从边缘需求变成独立赛道。
  3. Trendshift 独家发现
    • msitarzewski/agency-agents(AI Agency 智能体合集)在 GitHub Trending 上几乎不可见,但在社交媒体上获得了 +726/周的传播,是典型的”社交传播型”项目。
    • tinyhumansai/openhuman(个人 AI 超级智能,强调隐私和本地部署)+1.3k/周,反映了”个人化 AI”需求的崛起。

🔗 九源交叉分析

1. 跨源热门项目验证

以下项目/主题在 3 个及以上数据源 中同时出现,属于本周期 AI 领域的高确信度趋势:

项目/主题 出现的数据源 验证信号
andrej-karpathy-skills(AI 编码技能配置) GitHub 月榜#1 + 周榜 → OSSInsight 月榜#2 + 周榜#2 → Trendshift 日榜#1 + 周榜#2 ✅ 6 源验证,本月最强爆发项目
colbymchenry/codegraph(代码知识图谱) GitHub 月榜#11 + 周榜#7 → OSSInsight 月榜#13 + 周榜#1 → Trendshift 日榜#2 + 周榜#8 ✅ 6 源验证,知识图谱方向代表作
mattpocock/skills(Claude Code 技能集) GitHub 月榜#2 → OSSInsight 月榜#1 + 周榜#4 → Trendshift 周榜#4 ✅ 5 源验证,AI 技能赛道标杆
tinyhumansai/openhuman(个人 AI 超级智能) GitHub 周榜#3 → OSSInsight 月榜#10 + 周榜#5 → Trendshift 周榜#3 ✅ 5 源验证,个人化 AI 代表
HKUDS/ViMax(智能体视频生成) GitHub 月榜#19 + 周榜#14 → OSSInsight 月榜#30 + 周榜#30 ✅ 4 源验证,中国团队视频生成新星
rohitg00/agentmemory(AI Agent 持久记忆) GitHub 月榜#15 + 周榜#9 → OSSInsight 月榜#31 + 周榜#10 ✅ 4 源验证,Agent 基础设施方向
Qwen3.7-Max / DeepSeek-V4-Pro(国产开源模型) HN 周榜#1(Qwen3.7-Max 715分) → HF Models(DeepSeek-V4-Pro 霸榜) → Techmeme(DeepSeek 降价75%) ✅ 3 源验证,中国 AI 模型全面出击
AI 成本焦虑 HN「AI 太贵了」142分 + 「微软报告 AI 比人类贵」224分 → Techmeme OpenAI 亏损122% → Reddit 学术诚信讨论 ✅ 3 源验证,行业共识级趋势
Claude Code 生态 GitHub(多项目)→ OSSInsight(霸榜)→ Trendshift(5/10 项目相关)→ Product Hunt(Kilo Code #1) ✅ 4 源验证,当前最强 AI 编码生态

2. 各源独家发现

数据源 独家发现 说明
GitHub Trending ruvnet/RuView(WiFi 信号空间感知) 技术路线极其新颖,仅 GitHub + Trendshift 可见
OSSInsight JuliusBrussee/caveman(削减 65% Token)、HKUDS/CLI-Anything 小而美的 Skills 类项目,其他源难捕捉
Hugging Face Models tencent/Hy-MT2 翻译系列三款、TencentARC/Pixal3D(图像转3D) 模型层面的独家发现,代码/新闻源无法覆盖
Hugging Face Papers Mean Mode Screaming(千层扩散 Transformer)、PhysBrain 1.0(物理 AI) 学术前沿独有视角
Hacker News AI Agent 安全事故系列(2346分)、社区 AI 疲劳信号 社区情绪与行业反思,其他源无法反映
Reddit r/ML arXiv LLM 禁令讨论(669分)、学术诚信危机、同行评审改革 学术社区独有议题
Product Hunt StoreClaw、PollyReach、mailX 等 Agent 化 SaaS 闭源商业化产品独有视角
Techmeme Karpathy 加入 Anthropic、DeepSeek 100 亿融资、Anthropic 估值 3800 亿 行业商业动态独家覆盖
Trendshift msitarzewski/agency-agentsmanaflow-ai/cmux 社交传播型项目,GitHub Trending 几乎不可见

3. 本期 AI 趋势一句话总结

AI Agent 从「对话玩具」走向「生产基础设施」,但成本焦虑、安全失控和学术泡沫正在同步升温。 Claude Code 生态以”技能包”模式爆发式增长占据开源绝对主导,中国 AI 力量(DeepSeek、Qwen、商汤等)在模型、论文和融资三线全面崛起,而 HN 和 Reddit 社区的 AI 疲劳信号与成本质疑表明行业正进入「理性验证期」。


📅 报告日期:2026-05-24 | 数据周期:2026-W21 (05-18 ~ 05-24)

数据来源:GitHub Trending · OSSInsight · Hugging Face Models · Hugging Face Papers · Hacker News · Reddit r/MachineLearning · Product Hunt · Techmeme · Trendshift