怎么样使用AI Coding工具可以节省token?
vibe coding的时候,发现一个小需求动辄几十万token,有没有什么节省token的小技巧?
怎么样使用AI Coding工具可以节省token?
vibe coding的时候,发现一个小需求动辄几十万token,有没有什么节省token的小技巧?
我这里两个方案
1.试试Rtk这个项目
主要解决的是Shell命令行一些无意义的输出
2.提高大模型缓存的命中率
ClaudeCode这种工具搭配自家模型,肯定命中率最高,但是换第三方模型就要做一些配置了
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
"CLAUDE_CODE_ATTRIBUTION_HEADER": "0"省token的本质是省钱,其实决策还挺复杂的:
面对长任务,不能过早的压缩上下文,否则大模型不能很好的了解信息,造成任务失败重试次数增多,消耗token更多
面对简单任务,需要及时压缩上下文,让大模型API请求的时候减少不相干的上下文信息消耗
这里有一个实验性质的agent在实现过程中尝试使用一些更加量化的方式处理上下文(而不是市面上的自媒体发的那种大而化之的不能实操的所谓的思想)
动态压缩决策:何时压缩?保留多少?
我最近做了一些关于Token效率的研究, 我让AI给出了一个报告,他说哪些地方可以节约token
这个报告是DeepSeek V4 Flash给出来的,目前节约Token,这个在量化上面有点难做,目前只能给出一个方向性的研究。 但是AI它现在目前认为是这样子。
10 回答1.2k 阅读
4 回答994 阅读✓ 已解决
6 回答857 阅读
3 回答958 阅读
3 回答945 阅读
4 回答787 阅读
所谓的 AI coding、vibe coding、Agentic coding 本质上就是一个客户端程序。它把用户(即您)提出的需求与当前项目的上下文一起发送给大语言模型的服务器。服务器收到需求后不一定能立即搞定,会返回需要的补充信息。客户端再把服务器要求的内容整理后再次发送给大语言模型的服务器。若您要求查找文档等,大语言模型会调用搜索工具进行检索。
因此,这类交互往往是多次来回的请求。如果在会话循环中让它完成所有任务,请求会越来越复杂,导致上下文溢出。每一次新的请求都会重新发送之前积累的对话历史和上下文,从而消耗大量 token,这就是 token 消耗特别快的原因。
要避免无意义地耗费token的办法很简单,就是:一事一议。下面说具体说明的视频:
https://www.bilibili.com/video/BV1G7i4BpEJm/?aid=115842381516...