怎么省钱:Claude Code 成本控制实战
📍 进阶 7/10 · 上一篇:← 出错怎么办:8 个常见报错速查

第一次用,大家都会撞这一脚
Section titled “第一次用,大家都会撞这一脚”你装好 Claude Code,第一周兴奋地试各种活。一个月后看一眼账单——
800 元。
你心里咯噔一下。这要是常态化,一年小一万。
冷静下来你会发现:不是 Claude Code 真的需要这么多钱——是你没掌握成本控制的几个基本手法。
读完这一篇你会知道:
- 怎么看当前每天 / 每月花了多少(
/cost命令) - 4 个真能省 30%+ 的手法
- 一个真实复盘:一周 200 元 → 4 招砍到 30 元
成本控制 = 家庭节能——监控用电 → 关大灯 → 换节能电器 → 减少待机功耗。Claude Code 也一样,先看清楚账单,再针对最大开销下手。
先搞清楚钱花在哪:/cost
Section titled “先搞清楚钱花在哪:/cost”
在 Claude Code 内输入:
/cost会输出大概这样一段:
Today's Usage:━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━Total spent: ¥18.42Total tokens: 1.2M in / 280k out
By Model: Opus 4.7 ¥14.20 (input 850k / output 180k) Sonnet 4.6 ¥3.85 (input 320k / output 80k) Haiku 4.5 ¥0.37 (input 30k / output 20k)
This Month: ¥184.20─────────────────────────────────────怎么读:
- Total spent — 今天花了多少
- Total tokens — 输入 / 输出 token 数(输出贵很多,通常是输入的 3-5 倍单价)
- By Model — 钱花在了哪个模型,这是最重要的一栏
- This Month — 本月累计
关键观察:80/20 规律——通常 80% 的钱花在 1-2 个模型上。针对那 1-2 个模型下手,效果最大。
手法 1:用便宜的模型做轻活
Section titled “手法 1:用便宜的模型做轻活”
最容易撞坑的地方——不分活轻活重,全部用 Opus 4.7 / DeepSeek-V4-Pro。
类比:你不会用越野车去买菜——5 公里以内骑共享单车更快、更省。
下表是任务跟模型的对应:
| 任务类型 | 推荐模型(Anthropic) | 推荐模型(DeepSeek) | 单价对比 |
|---|---|---|---|
| 改一行 typo / 重命名 | Haiku 4.5 | deepseek-v4-flash 非 thinking | 1× |
| 写 100 字回复 / 翻译一段 | Haiku 4.5 | deepseek-v4-flash 非 thinking | 1× |
| 改简历 / 写一个简单脚本 | Sonnet 4.6 | deepseek-v4-flash thinking 模式 | ~3× |
| 重构一个模块 / 设计架构 | Opus 4.7 | deepseek-v4-pro | ~10× |
| 想清楚一个产品决策 | Opus 4.7(thinking) | deepseek-v4-pro thinking | ~15× |
💡 不知道哪档,先这样:海外路径默认挂 Sonnet 4.6,国内路径默认挂 deepseek-v4-flash。撞到答不好 / 改不对,临时切到更贵的档(Opus / v4-pro)再问一次。问完切回来。新手第一个月不用想,这一招省 50%。
切模型怎么操作
Section titled “切模型怎么操作”/model会弹出菜单,挑你要的模型。Claude Code 记住选择,下条对话起就用新模型。
节奏建议:默认挂 Sonnet,遇到要深度思考的活临时升 Opus,遇到改一行小字临时降 Haiku。这样全天平均成本能砍 40-60%。
国内路径(DeepSeek)
Section titled “国内路径(DeepSeek)”如果你走 Claude Code + DeepSeek 配置,DeepSeek 现在主推两个 V4 系列模型:
deepseek-v4-flash— 284B 总参 / 13B 激活,轻活主力(对标 Haiku / Sonnet)deepseek-v4-pro— 1.6T 总参 / 49B 激活,重活旗舰(对标 Opus)
两个都原生 1M context + 支持 thinking / non-thinking 双模式(开 thinking 它会先想再回答,适合架构 / 难题)。
旧的
deepseek-chat/deepseek-reasoner还能用,但官方说将来会下线——对应到deepseek-v4-flash的两种模式。新装的人直接配 v4-flash / v4-pro。
DeepSeek 整体单价是 Anthropic 的 1/5 - 1/10,光「走 DeepSeek」这一条已经把成本砍掉 80%。
手法 2:打开 DeepSeek context caching
Section titled “手法 2:打开 DeepSeek context caching”
痛点:你跟 AI 连续聊同一个项目,CLAUDE.md 跟前 N 轮对话每次都要重新计费一遍——这部分内容是一模一样的,凭什么收钱?
DeepSeek 的解法:context caching——对重复出现的 token 块自动打折(只收 1/10 - 1/4 的价)。
自动开启(不用你手动配),触发条件:
- 同一个 session 第 2 条对话以后
- 前缀 token 跟前面对话完全一致(顺序也得一致)
怎么验证它真的生效
Section titled “怎么验证它真的生效”跑 /cost 时,输入 token 数应该比 token 实际数小(因为缓存部分被打折计费)。
典型省钱比例:
- 第一条对话:100% 计费
- 第 2-5 条:60% 计费(部分缓存命中)
- 第 5 条之后:30-40% 计费(高命中率)
一个 session 聊得越久,平均单价越低。
👉 一句话:你什么都不用做
Section titled “👉 一句话:你什么都不用做”DeepSeek 这套是自动开的。看到 Anthropic 原厂文档里教你写 cache 配置的代码——在 DeepSeek 路径上别照抄(配了也不生效)。新手只管聊,DeepSeek 自己会算账给你打折。
手法 3:精简 CLAUDE.md
Section titled “手法 3:精简 CLAUDE.md”
每次开 Claude Code 一个新 session,整个 CLAUDE.md 都会被全文加载到 context——意味着:
- CLAUDE.md 每多 100 行,每个 session 都多消耗 ~2-3k token
- 每天开 10 个 session,一个月就是几千 k 的额外消耗
真实数据:
- CLAUDE.md 800 行 → 每 session 起步 16-20k token
- CLAUDE.md 200 行 → 每 session 起步 4-5k token
- 差距 4 倍
Step 1:跑这个命令看你现在 CLAUDE.md 多大:
wc -l ~/.claude/CLAUDE.mdwc -l ./CLAUDE.md如果家目录的超过 200 行,或者单个项目目录的超过 300 行——该精简了(更详细的 CLAUDE.md 写作原则见 CLAUDE.md 是什么)。
Step 2:删 3 类内容:
- 过时规则(几个月前的项目,现在不做了)
- 重复规则(已经有同义条款的)
- 正常人都知道的「常识」(不要给我写 bug、要按 PEP8 写代码)
Step 3:分层放:
- 通用规则 →
~/.claude/CLAUDE.md(全局) - 项目特定 →
项目目录/CLAUDE.md - 模块特定 →
项目/子模块/CLAUDE.md
不要全部塞到家目录的 CLAUDE.md(那样每个项目都会被加载,白白消耗 context)。
📚 详细看 CLAUDE.md 是什么。
手法 4:及时 /compact 跟 /clear
Section titled “手法 4:及时 /compact 跟 /clear”跟 上下文窗口 那篇是同一个机制——context 越大,每条消息单价越高(因为整个 context 都要重新过一遍模型)。
节奏:
- ✅ 每聊到
/context显示 70%+,主动/compact一下 - ✅ 任务完成 / 切话题,立刻
/clear - ❌ 不要让一个 session 从早开到晚
省钱效果:
- 任务完成后不 /clear,继续在同一 session 聊下个任务 → context 一直累积 → 后面每条消息单价是前面 2-3 倍
- 任务完成 /clear → 单价回到基础 → 整体节省 30%+
实战复盘:一周 200 元 → 30 元
Section titled “实战复盘:一周 200 元 → 30 元”
下面是一个真实的「调优过程」,数据是脱敏后的实际项目:
| 阶段 | 行为 | 周成本 |
|---|---|---|
| 起步 | 全部用 Opus 4.7,从早聊到晚,CLAUDE.md 800 行 | ¥210 |
| + 手法 1 | 改成 Sonnet 4.6 为主,重活才上 Opus | ¥125(-40%) |
| + 手法 2 | 切到 DeepSeek 路径,自动 context caching | ¥48(-77%) |
| + 手法 3 | CLAUDE.md 砍到 180 行,分层放 | ¥35(-83%) |
| + 手法 4 | 切任务必 /clear,每天主动 /compact 1-2 次 | ¥28(-87%) |
最大杠杆:手法 1 + 手法 2 一起做,直接砍掉 70-80% 成本。手法 3、4 是锦上添花,再砍 20-30%。
三个新手最容易踩的坑
Section titled “三个新手最容易踩的坑”❌ 坑 1:听到「省钱」就只用最便宜的模型
Section titled “❌ 坑 1:听到「省钱」就只用最便宜的模型”“Haiku 便宜,我全用它。”
踩坑:Haiku 写不了复杂代码 / 不会架构思考,你让它做重活,它写出来的东西要返工 3 次——最终花的时间 + token 反而比直接用 Opus 一次写好更多。
修正:对的任务用对的模型,不要 one-size-fits-all。
❌ 坑 2:看到账单大就直接取消订阅
Section titled “❌ 坑 2:看到账单大就直接取消订阅”新手撞上账单大,第一反应是停用,然后用回豆包 / GPT 免费版。
踩坑:你失去了「让 AI 真的帮你干活」的能力。先用上面 4 个手法把成本砍下来,再决定要不要降级。
❌ 坑 3:不看 /cost,光凭感觉
Section titled “❌ 坑 3:不看 /cost,光凭感觉”“我感觉没花多少啊…”
踩坑:Token 计费完全反直觉——你聊了 1 小时,可能只花 ¥3;让 AI 读了一个大 PDF,可能 30 秒花 ¥15。没看过 /cost,你不知道钱花在哪。
修正:每天开干前看一眼 /cost,每周末看一次月累计。养成习惯之后,你对成本会有非常精准的直觉。
一份「省钱日常清单」
Section titled “一份「省钱日常清单」”每天开 Claude Code 之前,跑这一套检查:
- ✅
/cost— 昨天花了多少?今天预算多少? - ✅
/model— 当前默认模型对不对?重活用 Opus、轻活用 Sonnet/Haiku - ✅ 看一眼 CLAUDE.md 行数 — 月度内有没有膨胀?
- ✅ 上一个 session 收尾了吗? — 没收尾就
/clear新开 - ✅ 聊到 70%? — 主动
/compact
做到这 5 条,你的月费会自动稳定在「不用计较」的区间。
读完这一篇你应该会用 4 个核心省钱手法 + /cost 监控习惯。
接下来:
→ Slash Commands 全清单 —— 30+ 个 /xxx 命令的「必背 / 常用 / 偶尔」三档
→ 自定义 Skills —— 把重复活变成一行命令
想第一时间收到,可以收藏 niuxue.org 主页。
如果你跑完这一套手法,月费砍了 50%+,把你的对比数据发邮箱 [email protected],我们会精选放进文章做新案例。
评论
不记名、不需要注册——不要邮箱,不要手机号,不要任何身份信息,填个昵称就能留言。放心说。