怎么省钱:Claude Code 成本控制实战

📍 进阶 7/10 · 上一篇:← 出错怎么办:8 个常见报错速查

一个机器人帮人把鼓胀的钱包收瘦,硬币飞出去分类进罐子

第一次用,大家都会撞这一脚

你装好 Claude Code,第一周兴奋地试各种活。一个月后看一眼账单——

800 元。

你心里咯噔一下。这要是常态化,一年小一万。

冷静下来你会发现:不是 Claude Code 真的需要这么多钱——是你没掌握成本控制的几个基本手法。

读完这一篇你会知道:

怎么看当前每天 / 每月花了多少(/cost 命令)
4 个真能省 30%+ 的手法
一个真实复盘:一周 200 元 → 4 招砍到 30 元

成本控制 = 家庭节能——监控用电 → 关大灯 → 换节能电器 → 减少待机功耗。Claude Code 也一样,先看清楚账单,再针对最大开销下手。

先搞清楚钱花在哪:`/cost`

终端面板里显示成本柱状图和饼图

在 Claude Code 内输入:

/cost

会输出大概这样一段:

Today's Usage:
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Total spent:           ¥18.42
Total tokens:          1.2M in / 280k out

By Model:
  Opus 4.7        ¥14.20  (input 850k / output 180k)
  Sonnet 4.6      ¥3.85   (input 320k / output 80k)
  Haiku 4.5       ¥0.37   (input 30k / output 20k)

This Month: ¥184.20
─────────────────────────────────────

怎么读:

Total spent — 今天花了多少
Total tokens — 输入 / 输出 token 数(输出贵很多,通常是输入的 3-5 倍单价)
By Model — 钱花在了哪个模型,这是最重要的一栏
This Month — 本月累计

关键观察:80/20 规律——通常 80% 的钱花在 1-2 个模型上。针对那 1-2 个模型下手,效果最大。

手法 1:用便宜的模型做轻活

三个不同大小的机器人配三个不同重量的任务

最容易撞坑的地方——不分活轻活重,全部用 Opus 4.7 / DeepSeek-V4-Pro。

类比:你不会用越野车去买菜——5 公里以内骑共享单车更快、更省。

下表是任务跟模型的对应:

任务类型	推荐模型(Anthropic)	推荐模型(DeepSeek)	单价对比
改一行 typo / 重命名	Haiku 4.5	`deepseek-v4-flash` 非 thinking	1×
写 100 字回复 / 翻译一段	Haiku 4.5	`deepseek-v4-flash` 非 thinking	1×
改简历 / 写一个简单脚本	Sonnet 4.6	`deepseek-v4-flash` thinking 模式	~3×
重构一个模块 / 设计架构	Opus 4.7	`deepseek-v4-pro`	~10×
想清楚一个产品决策	Opus 4.7(thinking)	`deepseek-v4-pro` thinking	~15×

💡 不知道哪档,先这样:海外路径默认挂 Sonnet 4.6,国内路径默认挂 deepseek-v4-flash。撞到答不好 / 改不对,临时切到更贵的档(Opus / v4-pro)再问一次。问完切回来。新手第一个月不用想,这一招省 50%。

切模型怎么操作

/model

会弹出菜单,挑你要的模型。Claude Code 记住选择,下条对话起就用新模型。

节奏建议:默认挂 Sonnet,遇到要深度思考的活临时升 Opus,遇到改一行小字临时降 Haiku。这样全天平均成本能砍 40-60%。

国内路径(DeepSeek)

如果你走 Claude Code + DeepSeek 配置,DeepSeek 现在主推两个 V4 系列模型:

deepseek-v4-flash — 284B 总参 / 13B 激活,轻活主力(对标 Haiku / Sonnet)
deepseek-v4-pro — 1.6T 总参 / 49B 激活,重活旗舰(对标 Opus)

两个都原生 1M context + 支持 thinking / non-thinking 双模式(开 thinking 它会先想再回答,适合架构 / 难题)。

旧的 deepseek-chat / deepseek-reasoner 还能用,但官方说将来会下线——对应到 deepseek-v4-flash 的两种模式。新装的人直接配 v4-flash / v4-pro。

DeepSeek 整体单价是 Anthropic 的 1/5 - 1/10,光「走 DeepSeek」这一条已经把成本砍掉 80%。

手法 2:打开 DeepSeek context caching

相同的 token 反复进 cache 盒子,出来时带打折标签

痛点:你跟 AI 连续聊同一个项目,CLAUDE.md 跟前 N 轮对话每次都要重新计费一遍——这部分内容是一模一样的,凭什么收钱?

DeepSeek 的解法:context caching——对重复出现的 token 块自动打折(只收 1/10 - 1/4 的价)。

自动开启(不用你手动配),触发条件:

同一个 session 第 2 条对话以后
前缀 token 跟前面对话完全一致(顺序也得一致)

怎么验证它真的生效

跑 /cost 时,输入 token 数应该比 token 实际数小(因为缓存部分被打折计费)。

典型省钱比例:

第一条对话:100% 计费
第 2-5 条:60% 计费(部分缓存命中)
第 5 条之后:30-40% 计费(高命中率)

一个 session 聊得越久,平均单价越低。

👉 一句话:你什么都不用做

DeepSeek 这套是自动开的。看到 Anthropic 原厂文档里教你写 cache 配置的代码——在 DeepSeek 路径上别照抄(配了也不生效)。新手只管聊,DeepSeek 自己会算账给你打折。

手法 3:精简 CLAUDE.md

臃肿文档 vs 精简文档对比,剪刀 + 垃圾桶

每次开 Claude Code 一个新 session,整个 CLAUDE.md 都会被全文加载到 context——意味着:

CLAUDE.md 每多 100 行,每个 session 都多消耗 ~2-3k token
每天开 10 个 session,一个月就是几千 k 的额外消耗

真实数据:

CLAUDE.md 800 行 → 每 session 起步 16-20k token
CLAUDE.md 200 行 → 每 session 起步 4-5k token
差距 4 倍

精简策略

Step 1:跑这个命令看你现在 CLAUDE.md 多大:

wc -l ~/.claude/CLAUDE.md
wc -l ./CLAUDE.md

如果家目录的超过 200 行,或者单个项目目录的超过 300 行——该精简了(更详细的 CLAUDE.md 写作原则见 CLAUDE.md 是什么)。

Step 2:删 3 类内容:

过时规则(几个月前的项目,现在不做了)
重复规则(已经有同义条款的)
正常人都知道的「常识」(不要给我写 bug、要按 PEP8 写代码)

Step 3:分层放:

通用规则 → ~/.claude/CLAUDE.md(全局)
项目特定 → 项目目录/CLAUDE.md
模块特定 → 项目/子模块/CLAUDE.md

不要全部塞到家目录的 CLAUDE.md(那样每个项目都会被加载,白白消耗 context)。

📚 详细看 CLAUDE.md 是什么。

手法 4:及时 `/compact` 跟 `/clear`

跟上下文窗口那篇是同一个机制——context 越大,每条消息单价越高(因为整个 context 都要重新过一遍模型)。

节奏:

✅ 每聊到 /context 显示 70%+,主动 /compact 一下
✅ 任务完成 / 切话题,立刻 /clear
❌ 不要让一个 session 从早开到晚

省钱效果:

任务完成后不 /clear,继续在同一 session 聊下个任务 → context 一直累积 → 后面每条消息单价是前面 2-3 倍
任务完成 /clear → 单价回到基础 → 整体节省 30%+

实战复盘:一周 200 元 → 30 元

柱状图根柱子依次递减,展示 4 招累积省下的钱

下面是一个真实的「调优过程」,数据是脱敏后的实际项目:

阶段	行为	周成本
起步	全部用 Opus 4.7,从早聊到晚,CLAUDE.md 800 行	¥210
+ 手法 1	改成 Sonnet 4.6 为主,重活才上 Opus	¥125(-40%)
+ 手法 2	切到 DeepSeek 路径,自动 context caching	¥48(-77%)
+ 手法 3	CLAUDE.md 砍到 180 行,分层放	¥35(-83%)
+ 手法 4	切任务必 /clear,每天主动 /compact 1-2 次	¥28(-87%)

最大杠杆:手法 1 + 手法 2 一起做,直接砍掉 70-80% 成本。手法 3、4 是锦上添花,再砍 20-30%。

三个新手最容易踩的坑

❌ 坑 1:听到「省钱」就只用最便宜的模型

“Haiku 便宜,我全用它。”

踩坑:Haiku 写不了复杂代码 / 不会架构思考,你让它做重活,它写出来的东西要返工 3 次——最终花的时间 + token 反而比直接用 Opus 一次写好更多。

修正:对的任务用对的模型,不要 one-size-fits-all。

❌ 坑 2:看到账单大就直接取消订阅

新手撞上账单大,第一反应是停用,然后用回豆包 / GPT 免费版。

踩坑:你失去了「让 AI 真的帮你干活」的能力。先用上面 4 个手法把成本砍下来,再决定要不要降级。

❌ 坑 3:不看 `/cost`,光凭感觉

“我感觉没花多少啊…”

踩坑:Token 计费完全反直觉——你聊了 1 小时,可能只花 ¥3;让 AI 读了一个大 PDF,可能 30 秒花 ¥15。没看过 /cost,你不知道钱花在哪。

修正:每天开干前看一眼 /cost,每周末看一次月累计。养成习惯之后,你对成本会有非常精准的直觉。

一份「省钱日常清单」

每天开 Claude Code 之前,跑这一套检查:

✅ /cost — 昨天花了多少?今天预算多少?
✅ /model — 当前默认模型对不对?重活用 Opus、轻活用 Sonnet/Haiku
✅ 看一眼 CLAUDE.md 行数 — 月度内有没有膨胀?
✅ 上一个 session 收尾了吗? — 没收尾就 /clear 新开
✅ 聊到 70%? — 主动 /compact

做到这 5 条,你的月费会自动稳定在「不用计较」的区间。

下一步

读完这一篇你应该会用 4 个核心省钱手法 + /cost 监控习惯。

接下来:

→ Slash Commands 全清单 —— 30+ 个 /xxx 命令的「必背 / 常用 / 偶尔」三档

→ 自定义 Skills —— 把重复活变成一行命令

想第一时间收到,可以收藏 niuxue.org 主页。

如果你跑完这一套手法,月费砍了 50%+,把你的对比数据发邮箱 [email protected],我们会精选放进文章做新案例。

不记名、不需要注册——不要邮箱，不要手机号，不要任何身份信息，填个昵称就能留言。放心说。

加载中 …