怎么样使用AI Coding工具可以节省token？ vibe coding的时候，发现一个小需求动辄几十万token，有没有什么节省token的小技巧？

省token的本质是省钱，其实决策还挺复杂的：面对长任务，不能过早的压缩上下文，否则大模型不能很好的了解信息，造成任务失败重试次数增多，消耗token更多面对简单任务，需要及时压缩上下文，让大模型API请求的时候减少不相干的上下文信息消耗这里有一个实验性质的agent在实现过程中尝试使用一些更加量化的方式处理上下文（而不是市面上的自媒体发的那种大而化之的不能实操的所谓的思想） <a href="https://link.segmentfault.com/?enc=lJOukWj3Lx9%2FlxBI8JNMSA%3D%3D.fMtWxTwFih%2Fe3bUrJkRsa4X7dPmAiGHvL%2B7mo2w3GAs%2BoZA2onOjQCiPwFJLEZ9VwBN7OI73nHInyEK7Z0R1ACj6MVr%2BN68lNA%2BOAr51ZS9IRLv5hPbaduoxCLPn4u%2BcH71UdeaejtXWSYmUVqoMsYJAHM4rR4YB67u79rB5CpnqV7p0ThRt8fgQEr%2F3tnz%2FlvhrhYYIyufdKPAEFz0t3OdRz8tjWnxEE500Fx3M7loqwjzD9ebjUPtXNBbRpOYDSXW3eQplvuNSH42zRNwkQA%3D%3D" rel="nofollow" target="_blank">动态压缩决策：何时压缩？保留多少？

我最近做了一些关于Token效率的研究，我让AI给出了一个报告，他说哪些地方可以节约token 这个报告是DeepSeek V4 Flash给出来的，目前节约Token，这个在量化上面有点难做，目前只能给出一个方向性的研究。但是AI它现在目前认为是这样子。

AI Coding时如何有效减少Token消耗？

ClaudeCode中文

663

发布于
5 月 19 日上海

更新于
5 月 19 日

所谓的 AI coding、vibe coding、Agentic coding 本质上就是一个客户端程序。它把用户（即您）提出的需求与当前项目的上下文一起发送给大语言模型的服务器。服务器收到需求后不一定能立即搞定，会返回需要的补充信息。客户端再把服务器要求的内容整理后再次发送给大语言模型的服务器。若您要求查找文档等，大语言模型会调用搜索工具进行检索。

因此，这类交互往往是多次来回的请求。如果在会话循环中让它完成所有任务，请求会越来越复杂，导致上下文溢出。每一次新的请求都会重新发送之前积累的对话历史和上下文，从而消耗大量 token，这就是 token 消耗特别快的原因。

要避免无意义地耗费token的办法很简单，就是：一事一议。下面说具体说明的视频：
https://www.bilibili.com/video/BV1G7i4BpEJm/?aid=115842381516...

witt

7591928

发布于
5 月 26 日陕西

我这里两个方案

1.试试Rtk这个项目

主要解决的是Shell命令行一些无意义的输出

https://github.com/rtk-ai/rtk

2.提高大模型缓存的命中率

ClaudeCode这种工具搭配自家模型，肯定命中率最高，但是换第三方模型就要做一些配置了

"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
"CLAUDE_CODE_ATTRIBUTION_HEADER": "0"

lloyd_zhou

1.7k229

发布于
5 月 28 日湖北

省token的本质是省钱，其实决策还挺复杂的：
面对长任务，不能过早的压缩上下文，否则大模型不能很好的了解信息，造成任务失败重试次数增多，消耗token更多
面对简单任务，需要及时压缩上下文，让大模型API请求的时候减少不相干的上下文信息消耗

这里有一个实验性质的agent在实现过程中尝试使用一些更加量化的方式处理上下文（而不是市面上的自媒体发的那种大而化之的不能实操的所谓的思想）
动态压缩决策：何时压缩？保留多少？

夜柒朔

204

发布于
6 月 2 日广东

用免费的工具，trae IDE，随便照。

eieiieieiei4

1893

发布于
6 月 3 日湖北

别再给AI塞整个项目了。你发给模型的每一行注释、每一个空行，都在烧钱。正确的做法是只传递函数签名和关键逻辑，我有个脚本能自动帮你做这件事。

粗眉毛的羽毛球

3

发布于
6 月 16 日四川

新手上路，请多包涵

我最近做了一些关于Token效率的研究，我让AI给出了一个报告，他说哪些地方可以节约token

Screenshot 2026-06-16 at 16.41.51.png

这个报告是DeepSeek V4 Flash给出来的，目前节约Token，这个在量化上面有点难做，目前只能给出一个方向性的研究。但是AI它现在目前认为是这样子。

AI Coding时如何有效减少Token消耗？

本地部署大模型，有没有推荐的模型呢？

零基础学Vibe Coding，哪个Agent AI最适合入门？

AI时代程序员是否会被完全取代？出路在哪里？

我的公司给了我 gemini 的 api key，但是我在中国大陆要怎么配置使用呢？

请问下为何可以：使用API中转来大幅降低Claude Code的使用成本？

为什么没有大厂下场做 skill hub 呢？