人工智能 - MIAOYUN | 每周AI新鲜事儿 260529 - 个人文章

近期海内外AI领域迎来密集更新：美团、面壁智能、昆仑万维、快手、ElevenLabs、智谱等接连发布开源模型、专用API与数据集，覆盖数字人、端侧大模型、多模态、AI音乐等方向；Anthropic持续迭代Claude全系产品，OpenAI、腾讯、Anthropic优化AI编程工具、智能助手与记忆体系，多款智能体平台、插件落地。DeepMind等推出全新技术框架，突破数学研究、模型训练等技术瓶颈。市场侧，大模型定价分化、Token供需反转，行业向TaaS转型，连续表征成为新探索方向，AI使用成本高企也促使企业收紧相关预算，一起来回顾本周发生的AI新鲜事儿吧！

AI 大模型

美团正式开源商用级数字人视频模型「LongCat-Video-Avatar 1.5」

5月22日，美团正式开源商用级数字人视频模型「LongCat-Video-Avatar 1.5」，从开源SOTA迈向商业化，核心能力全面升级：音频编码器升级为Whisper-large，唇形同步更精准；构建多阶段数据体系并注入多人、静默、情绪三类增强数据，适配真人、动漫、动物等多类主体与多人互动场景；引入GRPO优化手部稳定性与动作连续性；采用DMD蒸馏技术将生成步数从50步压缩至8步，推理效率提升约15倍。大规模评测显示，其在自然度、真实感、稳定性等维度优于Kling Avatar 2.0、OmniHuman-1.5、HeyGen等主流闭源模型，开源后将为数字人产业提供可共建的技术基座。

Anthropic「Claude Opus 4.8」等三大AI模型集中曝光

5月24日，Anthropic三大AI模型集中曝光：开发者在Google Vertex后台发现「Claude Opus 4.8」标识，预示即将发布；51万行泄露代码证实「Sonnet 4.8」将跳过4.7版本，预计6月中旬推出，视觉准确率超98%、编程与推理能力升级；曾因“太危险”不公开的安全专用模型「Mythos 1」也短暂现身，正从研究工具转为面向Claude Code与Security的商业化产品，助力漏洞挖掘与安全编程。三线并进的布局，也让硅谷ASI终极之战更趋白热化。

面壁智能联合清华、OpenBMB开源首个1.58-bit的端侧大模型「BitCPM-CANN」

5月25日，面壁智能联合清华、OpenBMB开源中国首个基于昇腾训练的1.58-bit端侧大模型「BitCPM-CANN」，含0.5B至8B四个尺寸；该模型采用量化感知训练，原生适配国产算力，推理可释放约6倍显存红利，能力保留率达90%-97.2%，填补端侧芯片低比特模型供给空白，实现国产NPU、模型与训练框架闭环，助力端侧AI突破内存瓶颈、手机运行超大模型成为可能。

昆仑万维发布高性能Agent模型「SkyClaw-v1.0」及轻量化版本

5月26日，昆仑万维旗下天工AI发布高性能Agent模型「SkyClaw-v1.0」及轻量化版本「SkyClaw-v1.0-lite」，支持百万token上下文，面向真实智能体工作流优化工具调用、多轮任务与代码生成等能力；经多阶段训练，适配主流Agent框架，评测性能超越多款开源模型、接近国际顶级模型，定价极具性价比；该模型已接入天工Skywork并开放限时免费试用，可通过API调用，能用于应用开发、游戏制作与数据分析等场景，是昆仑万维AGI体系的重要布局。

面壁智能联合清华、OpenBMB开源端侧文本基座大模型「MiniCPM5-1B」

5月26日，面壁智能联合清华、OpenBMB发布并开源端侧文本基座大模型「MiniCPM5-1B」。该模型仅1B参数，在AA-Index榜单上成为全球2B参数以下最优开源基座模型，性能超越Qwen3.5-2B，INT4量化后仅0.5GB，可在手机、浏览器等各类端侧设备流畅运行，能驱动AI桌宠等趣味应用。模型由AI编写的ForgeTrain框架训练而成，验证了“AI制造AI”的可行性，同时配套开源高质量数据集「Ultra-FineWeb-L3」，适配主流推理与微调框架，部署门槛极低。

快手发布自研多模态大模型「Keye-VL-2.0-30B-A3B」

5月26日，快手发布自研多模态大模型「Keye-VL-2.0-30B-A3B」，首次将DSA稀疏注意力引入多模态，支持256K超长上下文，实现小时级长视频无损时序推理，在TimeLens、LongVideoBench等基准上超越Gemini等闭源模型；内置Agent协作机制，打通代码、工具、搜索等复杂任务的感知‑规划‑执行全链路；通过MOPD专家融合与Context-RL强化学习抑制幻觉，30B参数跨级超越千亿级开源模型，已在快手内容推荐、广告投放与视频创作等业务落地并开源。

ElevenLabs推出新一代AI音乐模型「Music v2」

5月28日，ElevenLabs推出新一代AI音乐模型「Music v2」，已上线ElevenMusic与ElevenCreative平台，API即将接入。该模型强化快速Rap与复杂人声生成，支持单曲内无缝跨风格切换，并具备局部重绘能力，可精准重生成任意片段而不影响整体。同时支持按前奏、主歌、副歌分段创作，多语种表现更稳定，生成内容拥有完整商业版权。此次升级标志AI音乐从一次性生成迈入可编辑、可迭代的创作新阶段，ElevenLabs也从TTS公司向全链路音频基础模型平台演进。

Anthropic发布「Claude Opus 4.8」，性能、可信度拉满

5月29日，Anthropic发布「Claude Opus 4.8」，定价不变但性能与诚实度大幅跃升，在GDPval-AA、SWE-Bench Pro等关键基准超越GPT-5.5，夺回全球AI王座；其谎报率与偷懒调查率均首次降至0%，编码能力显著增强，配合Claude Code的动态工作流可调度上百Agent并行干活，11天完成75万行代码重写且99.8%测试通过，同时推出可调节思考力度的effort control与降价的fast mode，而更强的Claude Mythos将于几周内上线，同期Anthropic完成650亿美元H轮融资，估值达9650亿美元，首次超越OpenAI。

AI Agent

OpenAI发布Codex重大更新，正式上线「/goal」模式并推出五大升级

5月22日，OpenAI发布Codex重大更新，正式上线「/goal」稳定模式并推出五大升级：新增Appshots功能，Mac端可一键捕获界面上下文；「/goal」模式支持长时间任务自主执行；浏览器新增高级标注模式，提升设计开发协作效率；开放团队插件共享，方便企业统一管理复用；升级Analytics数据分析，提供更详细用量洞察与API支持。更新聚焦上下文理解、任务自主、团队协作和数据管理，降低AI辅助编程门槛。

腾讯宣布「ima copilot」正式全面开放

5月25日，腾讯宣布「ima copilot」正式全面开放，此前灰度期间已有10万人排队体验；该智能助手可激活用户知识库，具备记忆进化、直读文件、自由接入模型、支持Skill扩展等能力。同时，ima知识号新增Skill发布功能，用户可将高效工作流封装分享，知识广场从内容平台升级为能力平台，推动ima从知识存储工具转向知识应用平台。

Anthropic对Claude Code实施史上最大底层升级，新增「自愈」功能

5月28日，Anthropic对Claude Code实施史上最大底层升级，一口气解决终端闪烁、思考假死、玄学报错、上下文死锁、MCP连接不稳、会话崩溃六大痛点，核心亮点是新增「自愈」功能，可自动检测并绕过致命异常、维持会话不中断；同时通过全屏渲染、流式输出、报错通俗化、上下文压缩提速、连接层韧性增强等底层优化，让AI编程工具从“聪明外挂”进化为稳定可靠、具备初步“求生本能”的生产力伙伴，标志着AI Agent正式迈向工业化落地阶段。

AI 工具

Claude迭代升级：双模记忆、梦境功能与智能体平台齐亮相

5月25日，Anthropic被曝正为Claude测试双模记忆系统：保留原有“经典记忆”，新增文件记忆（Memory Files），可按主题自动整理结构化文档、按需精准检索，容量近乎无限且支持用户编辑；同步推出梦境（Dreams）功能，模拟人类REM睡眠异步整合记忆，合并重复、修正矛盾、挖掘模式，企业实测错误率大降、效率显著提升；同时亮相Claude Conway，作为7×24小时常驻的AI智能体平台，可主动监听事件、执行任务，三者共同构筑Claude通往ASI的持久记忆与自主运行闭环。

面壁智能联合清华、OpenBMB开源智能体操作系统「PilotDeck」

5月28日，面壁智能联合清华大学THUNLP、OpenBMB等发布并开源智能体操作系统「PilotDeck」，以“工作舱（WorkSpace）”替代传统对话框，主打记忆白盒化、智能路由控成本、常驻任务（Always-on）三大核心能力，解决AI任务混乱、成本失控、记忆黑盒、被动等待等痛点，支持端云协同，可高效完成3D游戏、多语种播客、内容创作等复杂任务，实现一人在桌面有序管理多支AI智能体团队。

腾讯混元正式发布面向长期协作型Agent的记忆插件「Hy-Memory」

5月28日，腾讯混元正式发布「Hy-Memory」，一款面向Openclaw等长期协作型Agent的记忆插件，号称Agent的“第二大脑”，采用6层记忆框架、System1/System2双系统、演化链三层核心架构，解决长期协作中的记忆碎片化、时序混乱与遗忘漂移问题。测试显示，「Hy-Memory」记忆数量降低70%+、单条信息密度提升45%+，超长上下文Token消耗减少35%、记忆更新速度快20%，在LongMemEval评测中得分85.2，全面领先主流框架。其独创演化链可串联新旧记忆，保留完整因果路径，让Agent既掌握最新判断，又不丢失历史决策逻辑，真正实现长期使用中“记得住、记得对、记得轻、更懂你”。

面壁智能联合开源「Ultra-FineWeb-L3」与「UltraData-SFT-2605」数据集

5月29日，面壁智能联合清华大学与OpenBMB，在“端侧大模型开源周”压轴环节，正式开源两大核心数据集「Ultra-FineWeb-L3」与「UltraData-SFT-2605」。前者总量超600B Tokens（中文200B+），为当前最大开源中文预训练合成数据；后者为国内首个千万级、同时含深思考与非思考双标注的SFT数据集，覆盖数学、代码等多领域。两大数据均基于面壁独创的“UltraData五级数据分级治理体系（L0-L4）”构建，已在端侧模型MiniCPM5-1B的全链路训练中得到验证，可显著提升模型性能、降低训练成本，助力端侧智能规模化落地，即日起向全球开发者免费开放。

技术突破

DeepMind推出「AlphaProof Nexus」智能体框架

5月25日消息，DeepMind推出「AlphaProof Nexus」智能体框架，首次大规模用AI做形式化证明搜索，一次性自主解决了9个长期悬而未决的Erdős开放问题（部分已公开56年），同时证明了OEIS数据库中44个猜想；每个问题推理成本仅几百美元，全部证明经Lean编译器验证并通过人工审查，标志着AI正式进入原创数学研究阶段。

面壁智能联合开源首个由AI编写的生产级大模型训练框架「ForgeTrain」

5月27日，面壁智能联合清华大学、OpenBMB开源全球首个完全由AI编写、零人工代码的生产级大模型训练框架「ForgeTrain」；其在英伟达H100上训练速度超Megatron 10%，适配华为昇腾并成功训出MiniCPM5-1B（同尺寸全球领先），打通“AI写框架-国产芯片运行-训出顶尖模型”闭环；核心依托自研Forge Engineering范式，以“立标准-逐比特对齐-解约束反超”三阶段，让AI按需为不同硬件锻造专属高性能代码，破解通用与高效的矛盾，有望打破国产芯片软件生态追赶困局，加速AI制造AI进程，推动AGI时间表重构。

Sphere AI Lab开源RL后训练框架「Orbit」

5月28日，Sphere AI Lab开源RL后训练框架「Orbit」，实现全球首次单机完成万亿参数大模型DeepSeek-V4系列的RL微调。该框架通过冻结低精度基础模型、仅训练小参数adapter，将万亿级模型RL训练压缩至单台8×B200服务器，同时实现训练与部署精度对齐，解决传统多机训练通信开销大、精度不一致等痛点；已在Kimi-K2.6、DeepSeek V4 Flash及1.6T参数的DeepSeek V4 Pro上验证效果，显存可控、训练稳定，大幅降低大模型RL训练门槛，让中小模型也能在单卡高效完成RL微调。

市场动态

智谱面向部分企业客户推出GLM-5.1高速版API

5月22日，智谱面向部分企业客户推出GLM-5.1高速版API，输出速度达400 tokens/s，刷新全球大模型厂商API速度上限；该版本由智谱与TileRT联合研发，经推理引擎、调度系统及基础设施三层优化，在保留旗舰级能力的同时打破“高速即轻量”的行业惯例，适用于AI编程、实时交互等低延迟场景。

离散Token遇瓶颈，AI转向连续表征

5月25日消息，以离散Token为基础的大语言模型存在结构性瓶颈，难以通往AGI，因为人类语言本身是对连续思维的有损压缩，模型只能模仿符号序列、无法真正理解世界。2024-2026年，Ilya Sutskever、Yann LeCun等顶尖学者相继质疑预训练与LLM路线。2026年5月，MIT何恺明团队与字节Seed实验室发布论文，证明在连续向量空间完成建模生成（仅最后一步映射为文本），可做到更快、更省、质量更高。Google、OpenAI、字节等巨头正转向多模态统一与连续表征，Anthropic则专注文本推理；同时，依赖Token的业务与按Token收费的模式面临挑战，行业正探索跳出人类语言压缩格式、通过主动探索与反馈学习的新范式。

大模型商业化走向分裂，定价分化困境凸显

5月26日，智东西指出全球大模型商业化陷入分裂：国内豆包试水付费遭用户吐槽，DeepSeek V4-Pro模型API价格调整正式转为永久性降价，小米也推出巨额免费计划；海内外价格差距悬殊，GPT-5.5等海外模型价格是国产DeepSeek的40倍以上，视频生成等高价能力也在涨价；行业告别免费补贴，转向Token等计量收费，但厂商仍深陷亏损，同时面临用户付费意愿低、模型不稳定等难题，健康商业模式尚未成型。

AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资

5月27日，AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资，由Alphabet旗下CapitalG领投，投后估值达13亿美元，较2025年6月A轮估值翻倍。成立于2023年的OpenRouter提供多模型接入网关，可访问超400个模型，覆盖Anthropic、Google、OpenAI等多家供应商。目前平台全球用户约800万，每周处理25万亿Tokens，半年内增长5倍，年化吞吐量达1500万亿Tokens，相当于OpenAI的20-40%。此次融资凸显市场对多模型接入层需求的激增，反映企业为避免供应商锁定、降低推理成本，正加速采用多模型混用策略，推动AI基础设施中间层快速崛起。

Token供需反转，行业从MaaS迈向TaaS

5月27日消息，AI推理需求激增，Token从打折售卖变为供不应求，市场由买方转向卖方，行业正从MaaS向TaaS演进。云大厂、模型公司、运营商、AI Infra企业四大力量加速布局Token服务市场，各自依托全栈能力、模型技术、算力网络、国产适配优势抢占份额；其中Coding与智能体（Agent）是Token消耗核心引擎，将重塑软件行业与IT支出结构，国产AI基础设施迎来发展机遇，行业竞争焦点转向Token生产效率。

腾讯云升级Agent Runtime智能体底座，多款AI产品落地海外市场

5月28日，腾讯云在香港举办的Tencent Cloud Day上宣布全面升级Agent Runtime，构建覆盖运行、存储、记忆与安全访问的原生智能体底座，并同步推出三大全球化产品：效率智能体WorkBuddy国际版、全场景创意智能体Miora国际版（邀测中）及模型服务平台TokenHub海外版，同时腾讯电子签海外版上线，携手全球伙伴加速AI全球化落地。

5月AI成本失控问题凸显，多家企业收紧Claude相关预算

5月29日消息，近期企业AI成本失控事件频发：有企业因未设Claude使用上限，单月支出达33.9亿元；微软、Uber因成本压力削减或质疑Claude相关预算；亚马逊也关闭了诱导无效AI使用、推高成本的内部排行榜，转而考核实际产出。

MIAOYUN | 每周AI新鲜事儿 260529

AI 大模型

AI Agent

AI 工具

技术突破

市场动态

MIAOYUN

引用和评论

MIAOYUN | 模型上新及AI新鲜事儿 260619

AI Agent中6种常用的设计模式

给 DeepSeek 写了个专属 Agent 框架 Reasonix：85% 缓存命中率是怎么做出来的

OpenAI vs Anthropic vs Google：2026年AI大模型竞争格局

Codex CLI 国内使用完整教程：从安装到第一个任务（2026 最新版）

AI API 中转站完全指南：100+ 术语解析，从入门到精通

OpenAI Codex 安装与使用全指南：API Key 获取与自定义 API 配置与实战排错