发布了文章6 月 23 日
每个 DeepSeek 缓存命中请求和未命中请求之间,横着一道 4.8 倍的价差——而在典型的 agent 循环里,命中还是未命中的差别,就在于你有没有把时间戳塞到提示词末尾。
发布了文章6 月 23 日
$20 Plus 套餐的 Codex 周限额,被一次长重构就可以在三小时内打空;OpenAI 唯一一次团队级重置发生在 2026 年 6 月 11 日。
发布了文章6 月 18 日
智谱一次宣布里塞下了三件事:1M token 上下文窗口、MIT 许可的开源权重、$10/月起价 —— 而且模型本身是前沿级 coding 模型。Z.ai Coding Plan API 和 MIT 权重都在 2026 年 6 月 22 日那周开放。如果你一直在等一个真能 fork 的开源权重 Claude Code 替代品,接下来...
发布了文章6 月 17 日
智谱的 GLM 5.2 已经正式开放:Z.ai 的 Coding Plan API、Hugging Face 上的 MIT 开源权重、以及 20 多个第三方 coding 工具的支持,全部同步上线,不再是"下周见"。更关键的是这次发布带了真实跑分——不是 PPT 上的宣传,是能复现的 benchmark。
赞了文章6 月 16 日
2026 年 6 月 9 日,Anthropic 放出 Claude Fable 5——第一个普通用户能摸到的“加了安全护栏的 Mythos 级模型”。它和受限的 Mythos 5 同源,只是在网络安全、生物、化学、模型蒸馏这几个敏感方向上会拒答或改道。
赞了文章6 月 16 日
每次打开 Claude Code 开始新对话,它都是一张白纸。昨天你花了 10 分钟解释的项目架构、你反复纠正的代码风格偏好、你建立的特殊开发规范——全部归零。但是使用过 OpenClaw 和 Hermes 的同学都知道,这 2 个 agent 具备持久化记忆系统,这让我开始思考:能不能给 Cla...
回答了问题6 月 16 日
个人认为程序员用ai跟普通人用ai还是有很大的差别,未来职业的边界会越来越模糊,程序员所手的代码逻辑思维让他们在使用ai时更高效,唯一需要补充的是理解现实世界需求的能力,也就是原来产品经理的能力,如果再能掌握一✍些流量和增长技能及认知,会是非常厉害的,自...
发布了文章6 月 16 日
如果你在一个 symlink 工作区里跑 Codex CLI,模型却装作 AGENTS.md 不存在——你不是疯了,你还在 v0.137 或更早。2026-06-08 发布的 v0.138.0 修的就是这个,背后两个 PR 悄悄重写了 Codex 解析指令路径的方式。
发布了文章6 月 14 日
最常见的就是 Fix 1——PATH 里没有 npm 全局 bin 目录。其余 6 个 fix 处理长尾。每一个都在 Codex CLI 0.137.0(2026-06-04 发布)上验过,环境包括 macOS 14、Ubuntu 24.04、Windows 11 + WSL2。
发布了文章6 月 14 日
cached-input 折扣大战已经收官。 2026 年 Anthropic 和 OpenAI 最新一代旗舰模型都把 cached 读取价砍到标准输入价的 10%——一个 9 折,最初是 Anthropic 的招牌,在 GPT-5.4 上线时被悄悄追平。真正值得问的问题不再是”谁的折扣更大”,而是哪家的 cache 机制能扛住...
发布了文章6 月 12 日
2026 年呼声最高的 Claude Code 功能,悄悄在 v2.1.169 上线了,多数人还不知道它切目录时能把提示缓存保住,不是清掉重来。
发布了文章6 月 12 日
TL;DR —— Anthropic 在 2026 年 6 月 9 日发布 Claude Fable 5,这是他们第一个面向公众的 Mythos 级模型。它在 SWE-bench Verified 拿 95.0%、SWE-bench Pro 80.3%——比 Opus 4.8 高 11 分、比 GPT-5.5 高 21.7 分。价格是 $10/$50 / 百万 token,正好是 Opus 4.8 的...
回答了问题6 月 11 日
他们是个小团队,每个成员各自创建 Key,可以统一管理,后台能看到每个人、每个项目的消耗明细。RPM 这块也省了不少事。之前直接调 Claude API,高峰期 429 报错一堆,Ofox 做了请求调度,限流的时候自动排队,不用自己处理。另外 Claude 挂的时候自动切 GPT-5.5,上...
回答了问题6 月 11 日
这种不需要大厂做,做了不见得比小团队做的好,要是想布局,收一个做的好的就可以了