近期海内外AI领域迎来密集更新:美团、面壁智能、昆仑万维、快手、ElevenLabs、智谱等接连发布开源模型、专用API与数据集,覆盖数字人、端侧大模型、多模态、AI音乐等方向;Anthropic持续迭代Claude全系产品,OpenAI、腾讯、Anthropic优化AI编程工具、智能助手与记忆体系,多款智能体平台、插件落地。DeepMind等推出全新技术框架,突破数学研究、模型训练等技术瓶颈。市场侧,大模型定价分化、Token供需反转,行业向TaaS转型,连续表征成为新探索方向,AI使用成本高企也促使企业收紧相关预算,一起来回顾本周发生的AI新鲜事儿吧!
AI 大模型
美团正式开源商用级数字人视频模型「LongCat-Video-Avatar 1.5」
5月22日,美团正式开源商用级数字人视频模型「LongCat-Video-Avatar 1.5」,从开源SOTA迈向商业化,核心能力全面升级:音频编码器升级为Whisper-large,唇形同步更精准;构建多阶段数据体系并注入多人、静默、情绪三类增强数据,适配真人、动漫、动物等多类主体与多人互动场景;引入GRPO优化手部稳定性与动作连续性;采用DMD蒸馏技术将生成步数从50步压缩至8步,推理效率提升约15倍。大规模评测显示,其在自然度、真实感、稳定性等维度优于Kling Avatar 2.0、OmniHuman-1.5、HeyGen等主流闭源模型,开源后将为数字人产业提供可共建的技术基座。
Anthropic「Claude Opus 4.8」等三大AI模型集中曝光
5月24日,Anthropic三大AI模型集中曝光:开发者在Google Vertex后台发现「Claude Opus 4.8」标识,预示即将发布;51万行泄露代码证实「Sonnet 4.8」将跳过4.7版本,预计6月中旬推出,视觉准确率超98%、编程与推理能力升级;曾因“太危险”不公开的安全专用模型「Mythos 1」也短暂现身,正从研究工具转为面向Claude Code与Security的商业化产品,助力漏洞挖掘与安全编程。三线并进的布局,也让硅谷ASI终极之战更趋白热化。
面壁智能联合清华、OpenBMB开源首个1.58-bit的端侧大模型「BitCPM-CANN」
5月25日,面壁智能联合清华、OpenBMB开源中国首个基于昇腾训练的1.58-bit端侧大模型「BitCPM-CANN」,含0.5B至8B四个尺寸;该模型采用量化感知训练,原生适配国产算力,推理可释放约6倍显存红利,能力保留率达90%-97.2%,填补端侧芯片低比特模型供给空白,实现国产NPU、模型与训练框架闭环,助力端侧AI突破内存瓶颈、手机运行超大模型成为可能。
昆仑万维发布高性能Agent模型「SkyClaw-v1.0」及轻量化版本
5月26日,昆仑万维旗下天工AI发布高性能Agent模型「SkyClaw-v1.0」及轻量化版本「SkyClaw-v1.0-lite」,支持百万token上下文,面向真实智能体工作流优化工具调用、多轮任务与代码生成等能力;经多阶段训练,适配主流Agent框架,评测性能超越多款开源模型、接近国际顶级模型,定价极具性价比;该模型已接入天工Skywork并开放限时免费试用,可通过API调用,能用于应用开发、游戏制作与数据分析等场景,是昆仑万维AGI体系的重要布局。
面壁智能联合清华、OpenBMB开源端侧文本基座大模型「MiniCPM5-1B」
5月26日,面壁智能联合清华、OpenBMB发布并开源端侧文本基座大模型「MiniCPM5-1B」。该模型仅1B参数,在AA-Index榜单上成为全球2B参数以下最优开源基座模型,性能超越Qwen3.5-2B,INT4量化后仅0.5GB,可在手机、浏览器等各类端侧设备流畅运行,能驱动AI桌宠等趣味应用。模型由AI编写的ForgeTrain框架训练而成,验证了“AI制造AI”的可行性,同时配套开源高质量数据集「Ultra-FineWeb-L3」,适配主流推理与微调框架,部署门槛极低。
快手发布自研多模态大模型「Keye-VL-2.0-30B-A3B」
5月26日,快手发布自研多模态大模型「Keye-VL-2.0-30B-A3B」,首次将DSA稀疏注意力引入多模态,支持256K超长上下文,实现小时级长视频无损时序推理,在TimeLens、LongVideoBench等基准上超越Gemini等闭源模型;内置Agent协作机制,打通代码、工具、搜索等复杂任务的感知‑规划‑执行全链路;通过MOPD专家融合与Context-RL强化学习抑制幻觉,30B参数跨级超越千亿级开源模型,已在快手内容推荐、广告投放与视频创作等业务落地并开源。
ElevenLabs推出新一代AI音乐模型「Music v2」
5月28日,ElevenLabs推出新一代AI音乐模型「Music v2」,已上线ElevenMusic与ElevenCreative平台,API即将接入。该模型强化快速Rap与复杂人声生成,支持单曲内无缝跨风格切换,并具备局部重绘能力,可精准重生成任意片段而不影响整体。同时支持按前奏、主歌、副歌分段创作,多语种表现更稳定,生成内容拥有完整商业版权。此次升级标志AI音乐从一次性生成迈入可编辑、可迭代的创作新阶段,ElevenLabs也从TTS公司向全链路音频基础模型平台演进。
Anthropic发布「Claude Opus 4.8」,性能、可信度拉满
5月29日,Anthropic发布「Claude Opus 4.8」,定价不变但性能与诚实度大幅跃升,在GDPval-AA、SWE-Bench Pro等关键基准超越GPT-5.5,夺回全球AI王座;其谎报率与偷懒调查率均首次降至0%,编码能力显著增强,配合Claude Code的动态工作流可调度上百Agent并行干活,11天完成75万行代码重写且99.8%测试通过,同时推出可调节思考力度的effort control与降价的fast mode,而更强的Claude Mythos将于几周内上线,同期Anthropic完成650亿美元H轮融资,估值达9650亿美元,首次超越OpenAI。
AI Agent
OpenAI发布Codex重大更新,正式上线「/goal」模式并推出五大升级
5月22日,OpenAI发布Codex重大更新,正式上线「/goal」稳定模式并推出五大升级:新增Appshots功能,Mac端可一键捕获界面上下文;「/goal」模式支持长时间任务自主执行;浏览器新增高级标注模式,提升设计开发协作效率;开放团队插件共享,方便企业统一管理复用;升级Analytics数据分析,提供更详细用量洞察与API支持。更新聚焦上下文理解、任务自主、团队协作和数据管理,降低AI辅助编程门槛。
腾讯宣布「ima copilot」正式全面开放
5月25日,腾讯宣布「ima copilot」正式全面开放,此前灰度期间已有10万人排队体验;该智能助手可激活用户知识库,具备记忆进化、直读文件、自由接入模型、支持Skill扩展等能力。同时,ima知识号新增Skill发布功能,用户可将高效工作流封装分享,知识广场从内容平台升级为能力平台,推动ima从知识存储工具转向知识应用平台。
Anthropic对Claude Code实施史上最大底层升级,新增「自愈」功能
5月28日,Anthropic对Claude Code实施史上最大底层升级,一口气解决终端闪烁、思考假死、玄学报错、上下文死锁、MCP连接不稳、会话崩溃六大痛点,核心亮点是新增「自愈」功能,可自动检测并绕过致命异常、维持会话不中断;同时通过全屏渲染、流式输出、报错通俗化、上下文压缩提速、连接层韧性增强等底层优化,让AI编程工具从“聪明外挂”进化为稳定可靠、具备初步“求生本能”的生产力伙伴,标志着AI Agent正式迈向工业化落地阶段。
AI 工具
Claude迭代升级:双模记忆、梦境功能与智能体平台齐亮相
5月25日,Anthropic被曝正为Claude测试双模记忆系统:保留原有“经典记忆”,新增文件记忆(Memory Files),可按主题自动整理结构化文档、按需精准检索,容量近乎无限且支持用户编辑;同步推出梦境(Dreams)功能,模拟人类REM睡眠异步整合记忆,合并重复、修正矛盾、挖掘模式,企业实测错误率大降、效率显著提升;同时亮相Claude Conway,作为7×24小时常驻的AI智能体平台,可主动监听事件、执行任务,三者共同构筑Claude通往ASI的持久记忆与自主运行闭环。
面壁智能联合清华、OpenBMB开源智能体操作系统「PilotDeck」
5月28日,面壁智能联合清华大学THUNLP、OpenBMB等发布并开源智能体操作系统「PilotDeck」,以“工作舱(WorkSpace)”替代传统对话框,主打记忆白盒化、智能路由控成本、常驻任务(Always-on)三大核心能力,解决AI任务混乱、成本失控、记忆黑盒、被动等待等痛点,支持端云协同,可高效完成3D游戏、多语种播客、内容创作等复杂任务,实现一人在桌面有序管理多支AI智能体团队。
腾讯混元正式发布面向长期协作型Agent的记忆插件「Hy-Memory」
5月28日,腾讯混元正式发布「Hy-Memory」,一款面向Openclaw等长期协作型Agent的记忆插件,号称Agent的“第二大脑”,采用6层记忆框架、System1/System2双系统、演化链三层核心架构,解决长期协作中的记忆碎片化、时序混乱与遗忘漂移问题。测试显示,「Hy-Memory」记忆数量降低70%+、单条信息密度提升45%+,超长上下文Token消耗减少35%、记忆更新速度快20%,在LongMemEval评测中得分85.2,全面领先主流框架。其独创演化链可串联新旧记忆,保留完整因果路径,让Agent既掌握最新判断,又不丢失历史决策逻辑,真正实现长期使用中“记得住、记得对、记得轻、更懂你”。
面壁智能联合开源「Ultra-FineWeb-L3」与「UltraData-SFT-2605」数据集
5月29日,面壁智能联合清华大学与OpenBMB,在“端侧大模型开源周”压轴环节,正式开源两大核心数据集「Ultra-FineWeb-L3」与「UltraData-SFT-2605」。前者总量超600B Tokens(中文200B+),为当前最大开源中文预训练合成数据;后者为国内首个千万级、同时含深思考与非思考双标注的SFT数据集,覆盖数学、代码等多领域。两大数据均基于面壁独创的“UltraData五级数据分级治理体系(L0-L4)”构建,已在端侧模型MiniCPM5-1B的全链路训练中得到验证,可显著提升模型性能、降低训练成本,助力端侧智能规模化落地,即日起向全球开发者免费开放。
技术突破
DeepMind推出「AlphaProof Nexus」智能体框架
5月25日消息,DeepMind推出「AlphaProof Nexus」智能体框架,首次大规模用AI做形式化证明搜索,一次性自主解决了9个长期悬而未决的Erdős开放问题(部分已公开56年),同时证明了OEIS数据库中44个猜想;每个问题推理成本仅几百美元,全部证明经Lean编译器验证并通过人工审查,标志着AI正式进入原创数学研究阶段。
面壁智能联合开源首个由AI编写的生产级大模型训练框架「ForgeTrain」
5月27日,面壁智能联合清华大学、OpenBMB开源全球首个完全由AI编写、零人工代码的生产级大模型训练框架「ForgeTrain」;其在英伟达H100上训练速度超Megatron 10%,适配华为昇腾并成功训出MiniCPM5-1B(同尺寸全球领先),打通“AI写框架-国产芯片运行-训出顶尖模型”闭环;核心依托自研Forge Engineering范式,以“立标准-逐比特对齐-解约束反超”三阶段,让AI按需为不同硬件锻造专属高性能代码,破解通用与高效的矛盾,有望打破国产芯片软件生态追赶困局,加速AI制造AI进程,推动AGI时间表重构。
Sphere AI Lab开源RL后训练框架「Orbit」
5月28日,Sphere AI Lab开源RL后训练框架「Orbit」,实现全球首次单机完成万亿参数大模型DeepSeek-V4系列的RL微调。该框架通过冻结低精度基础模型、仅训练小参数adapter,将万亿级模型RL训练压缩至单台8×B200服务器,同时实现训练与部署精度对齐,解决传统多机训练通信开销大、精度不一致等痛点;已在Kimi-K2.6、DeepSeek V4 Flash及1.6T参数的DeepSeek V4 Pro上验证效果,显存可控、训练稳定,大幅降低大模型RL训练门槛,让中小模型也能在单卡高效完成RL微调。
市场动态
智谱面向部分企业客户推出GLM-5.1高速版API
5月22日,智谱面向部分企业客户推出GLM-5.1高速版API,输出速度达400 tokens/s,刷新全球大模型厂商API速度上限;该版本由智谱与TileRT联合研发,经推理引擎、调度系统及基础设施三层优化,在保留旗舰级能力的同时打破“高速即轻量”的行业惯例,适用于AI编程、实时交互等低延迟场景。
离散Token遇瓶颈,AI转向连续表征
5月25日消息,以离散Token为基础的大语言模型存在结构性瓶颈,难以通往AGI,因为人类语言本身是对连续思维的有损压缩,模型只能模仿符号序列、无法真正理解世界。2024-2026年,Ilya Sutskever、Yann LeCun等顶尖学者相继质疑预训练与LLM路线。2026年5月,MIT何恺明团队与字节Seed实验室发布论文,证明在连续向量空间完成建模生成(仅最后一步映射为文本),可做到更快、更省、质量更高。Google、OpenAI、字节等巨头正转向多模态统一与连续表征,Anthropic则专注文本推理;同时,依赖Token的业务与按Token收费的模式面临挑战,行业正探索跳出人类语言压缩格式、通过主动探索与反馈学习的新范式。
大模型商业化走向分裂,定价分化困境凸显
5月26日,智东西指出全球大模型商业化陷入分裂:国内豆包试水付费遭用户吐槽,DeepSeek V4-Pro模型API价格调整正式转为永久性降价,小米也推出巨额免费计划;海内外价格差距悬殊,GPT-5.5等海外模型价格是国产DeepSeek的40倍以上,视频生成等高价能力也在涨价;行业告别免费补贴,转向Token等计量收费,但厂商仍深陷亏损,同时面临用户付费意愿低、模型不稳定等难题,健康商业模式尚未成型。
AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资
5月27日,AI模型聚合平台OpenRouter宣布完成1.13亿美元B轮融资,由Alphabet旗下CapitalG领投,投后估值达13亿美元,较2025年6月A轮估值翻倍。成立于2023年的OpenRouter提供多模型接入网关,可访问超400个模型,覆盖Anthropic、Google、OpenAI等多家供应商。目前平台全球用户约800万,每周处理25万亿Tokens,半年内增长5倍,年化吞吐量达1500万亿Tokens,相当于OpenAI的20-40%。此次融资凸显市场对多模型接入层需求的激增,反映企业为避免供应商锁定、降低推理成本,正加速采用多模型混用策略,推动AI基础设施中间层快速崛起。
Token供需反转,行业从MaaS迈向TaaS
5月27日消息,AI推理需求激增,Token从打折售卖变为供不应求,市场由买方转向卖方,行业正从MaaS向TaaS演进。云大厂、模型公司、运营商、AI Infra企业四大力量加速布局Token服务市场,各自依托全栈能力、模型技术、算力网络、国产适配优势抢占份额;其中Coding与智能体(Agent)是Token消耗核心引擎,将重塑软件行业与IT支出结构,国产AI基础设施迎来发展机遇,行业竞争焦点转向Token生产效率。
腾讯云升级Agent Runtime智能体底座,多款AI产品落地海外市场
5月28日,腾讯云在香港举办的Tencent Cloud Day上宣布全面升级Agent Runtime,构建覆盖运行、存储、记忆与安全访问的原生智能体底座,并同步推出三大全球化产品:效率智能体WorkBuddy国际版、全场景创意智能体Miora国际版(邀测中)及模型服务平台TokenHub海外版,同时腾讯电子签海外版上线,携手全球伙伴加速AI全球化落地。
5月AI成本失控问题凸显,多家企业收紧Claude相关预算
5月29日消息,近期企业AI成本失控事件频发:有企业因未设Claude使用上限,单月支出达33.9亿元;微软、Uber因成本压力削减或质疑Claude相关预算;亚马逊也关闭了诱导无效AI使用、推高成本的内部排行榜,转而考核实际产出。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。