跳转到内容

怎么省钱:Claude Code 成本控制实战

📍 进阶 7/10 · 上一篇:← 出错怎么办:8 个常见报错速查

一个机器人帮人把鼓胀的钱包收瘦,硬币飞出去分类进罐子

你装好 Claude Code,第一周兴奋地试各种活。一个月后看一眼账单——

800 元

你心里咯噔一下。这要是常态化,一年小一万

冷静下来你会发现:不是 Claude Code 真的需要这么多钱——是你没掌握成本控制的几个基本手法

读完这一篇你会知道:

  • 怎么看当前每天 / 每月花了多少(/cost 命令)
  • 4 个真能省 30%+ 的手法
  • 一个真实复盘:一周 200 元 → 4 招砍到 30 元

成本控制 = 家庭节能——监控用电 → 关大灯 → 换节能电器 → 减少待机功耗。Claude Code 也一样,先看清楚账单,再针对最大开销下手

终端面板里显示成本柱状图和饼图

在 Claude Code 内输入:

/cost

会输出大概这样一段:

Today's Usage:
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Total spent: ¥18.42
Total tokens: 1.2M in / 280k out
By Model:
Opus 4.7 ¥14.20 (input 850k / output 180k)
Sonnet 4.6 ¥3.85 (input 320k / output 80k)
Haiku 4.5 ¥0.37 (input 30k / output 20k)
This Month: ¥184.20
─────────────────────────────────────

怎么读:

  • Total spent — 今天花了多少
  • Total tokens — 输入 / 输出 token 数(输出贵很多,通常是输入的 3-5 倍单价)
  • By Model — 钱花在了哪个模型,这是最重要的一栏
  • This Month — 本月累计

关键观察:80/20 规律——通常 80% 的钱花在 1-2 个模型上。针对那 1-2 个模型下手,效果最大。

三个不同大小的机器人配三个不同重量的任务

最容易撞坑的地方——不分活轻活重,全部用 Opus 4.7 / DeepSeek-V4-Pro

类比:你不会用越野车去买菜——5 公里以内骑共享单车更快、更省

下表是任务跟模型的对应:

任务类型推荐模型(Anthropic)推荐模型(DeepSeek)单价对比
改一行 typo / 重命名Haiku 4.5deepseek-v4-flash 非 thinking
写 100 字回复 / 翻译一段Haiku 4.5deepseek-v4-flash 非 thinking
改简历 / 写一个简单脚本Sonnet 4.6deepseek-v4-flash thinking 模式~3×
重构一个模块 / 设计架构Opus 4.7deepseek-v4-pro~10×
想清楚一个产品决策Opus 4.7(thinking)deepseek-v4-pro thinking~15×

💡 不知道哪档,先这样:海外路径默认挂 Sonnet 4.6,国内路径默认挂 deepseek-v4-flash撞到答不好 / 改不对,临时切到更贵的档(Opus / v4-pro)再问一次。问完切回来。新手第一个月不用想,这一招省 50%

/model

会弹出菜单,挑你要的模型。Claude Code 记住选择,下条对话起就用新模型

节奏建议:默认挂 Sonnet,遇到要深度思考的活临时升 Opus,遇到改一行小字临时降 Haiku。这样全天平均成本能砍 40-60%

如果你走 Claude Code + DeepSeek 配置,DeepSeek 现在主推两个 V4 系列模型:

  • deepseek-v4-flash — 284B 总参 / 13B 激活,轻活主力(对标 Haiku / Sonnet)
  • deepseek-v4-pro — 1.6T 总参 / 49B 激活,重活旗舰(对标 Opus)

两个都原生 1M context + 支持 thinking / non-thinking 双模式(开 thinking 它会先想再回答,适合架构 / 难题)。

旧的 deepseek-chat / deepseek-reasoner 还能用,但官方说将来会下线——对应到 deepseek-v4-flash 的两种模式。新装的人直接配 v4-flash / v4-pro

DeepSeek 整体单价是 Anthropic 的 1/5 - 1/10,光「走 DeepSeek」这一条已经把成本砍掉 80%。

相同的 token 反复进 cache 盒子,出来时带打折标签

痛点:你跟 AI 连续聊同一个项目,CLAUDE.md 跟前 N 轮对话每次都要重新计费一遍——这部分内容是一模一样的,凭什么收钱?

DeepSeek 的解法:context caching——对重复出现的 token 块自动打折(只收 1/10 - 1/4 的价)。

自动开启(不用你手动配),触发条件:

  • 同一个 session 第 2 条对话以后
  • 前缀 token 跟前面对话完全一致(顺序也得一致)

/cost 时,输入 token 数应该比 token 实际数小(因为缓存部分被打折计费)。

典型省钱比例:

  • 第一条对话:100% 计费
  • 第 2-5 条:60% 计费(部分缓存命中)
  • 第 5 条之后:30-40% 计费(高命中率)

一个 session 聊得越久,平均单价越低

DeepSeek 这套是自动开的。看到 Anthropic 原厂文档里教你写 cache 配置的代码——在 DeepSeek 路径上别照抄(配了也不生效)。新手只管聊,DeepSeek 自己会算账给你打折。

臃肿文档 vs 精简文档对比,剪刀 + 垃圾桶

每次开 Claude Code 一个新 session,整个 CLAUDE.md 都会被全文加载到 context——意味着:

  • CLAUDE.md 每多 100 行,每个 session 都多消耗 ~2-3k token
  • 每天开 10 个 session,一个月就是几千 k 的额外消耗

真实数据:

  • CLAUDE.md 800 行 → 每 session 起步 16-20k token
  • CLAUDE.md 200 行 → 每 session 起步 4-5k token
  • 差距 4 倍

Step 1:跑这个命令看你现在 CLAUDE.md 多大:

Terminal window
wc -l ~/.claude/CLAUDE.md
wc -l ./CLAUDE.md

如果家目录的超过 200 行,或者单个项目目录的超过 300 行——该精简了(更详细的 CLAUDE.md 写作原则见 CLAUDE.md 是什么)。

Step 2:删 3 类内容:

  • 过时规则(几个月前的项目,现在不做了)
  • 重复规则(已经有同义条款的)
  • 正常人都知道的「常识」(不要给我写 bug、要按 PEP8 写代码)

Step 3:分层放:

  • 通用规则 → ~/.claude/CLAUDE.md(全局)
  • 项目特定 → 项目目录/CLAUDE.md
  • 模块特定 → 项目/子模块/CLAUDE.md

不要全部塞到家目录的 CLAUDE.md(那样每个项目都会被加载,白白消耗 context)。

📚 详细看 CLAUDE.md 是什么

上下文窗口 那篇是同一个机制——context 越大,每条消息单价越高(因为整个 context 都要重新过一遍模型)。

节奏:

  • ✅ 每聊到 /context 显示 70%+,主动 /compact 一下
  • ✅ 任务完成 / 切话题,立刻 /clear
  • 不要让一个 session 从早开到晚

省钱效果:

  • 任务完成后不 /clear,继续在同一 session 聊下个任务 → context 一直累积 → 后面每条消息单价是前面 2-3 倍
  • 任务完成 /clear → 单价回到基础 → 整体节省 30%+

柱状图 根柱子依次递减,展示 4 招累积省下的钱

下面是一个真实的「调优过程」,数据是脱敏后的实际项目:

阶段行为周成本
起步全部用 Opus 4.7,从早聊到晚,CLAUDE.md 800 行¥210
+ 手法 1改成 Sonnet 4.6 为主,重活才上 Opus¥125(-40%)
+ 手法 2切到 DeepSeek 路径,自动 context caching¥48(-77%)
+ 手法 3CLAUDE.md 砍到 180 行,分层放¥35(-83%)
+ 手法 4切任务必 /clear,每天主动 /compact 1-2 次¥28(-87%)

最大杠杆:手法 1 + 手法 2 一起做,直接砍掉 70-80% 成本。手法 3、4 是锦上添花,再砍 20-30%。

❌ 坑 1:听到「省钱」就只用最便宜的模型

Section titled “❌ 坑 1:听到「省钱」就只用最便宜的模型”

“Haiku 便宜,我全用它。”

踩坑:Haiku 写不了复杂代码 / 不会架构思考,你让它做重活,它写出来的东西要返工 3 次——最终花的时间 + token 反而比直接用 Opus 一次写好更多

修正:对的任务用对的模型,不要 one-size-fits-all。

❌ 坑 2:看到账单大就直接取消订阅

Section titled “❌ 坑 2:看到账单大就直接取消订阅”

新手撞上账单大,第一反应是停用,然后用回豆包 / GPT 免费版。

踩坑:你失去了「让 AI 真的帮你干活」的能力。先用上面 4 个手法把成本砍下来,再决定要不要降级。

“我感觉没花多少啊…”

踩坑:Token 计费完全反直觉——你聊了 1 小时,可能只花 ¥3;让 AI 读了一个大 PDF,可能 30 秒花 ¥15。没看过 /cost,你不知道钱花在哪

修正:每天开干前看一眼 /cost,每周末看一次月累计。养成习惯之后,你对成本会有非常精准的直觉

每天开 Claude Code 之前,跑这一套检查:

  • /cost — 昨天花了多少?今天预算多少?
  • /model — 当前默认模型对不对?重活用 Opus、轻活用 Sonnet/Haiku
  • ✅ 看一眼 CLAUDE.md 行数 — 月度内有没有膨胀?
  • ✅ 上一个 session 收尾了吗? — 没收尾就 /clear 新开
  • ✅ 聊到 70%? — 主动 /compact

做到这 5 条,你的月费会自动稳定在「不用计较」的区间

读完这一篇你应该会用 4 个核心省钱手法 + /cost 监控习惯

接下来:

Slash Commands 全清单 —— 30+ 个 /xxx 命令的「必背 / 常用 / 偶尔」三档

自定义 Skills —— 把重复活变成一行命令

想第一时间收到,可以收藏 niuxue.org 主页。


如果你跑完这一套手法,月费砍了 50%+,把你的对比数据发邮箱 [email protected],我们会精选放进文章做新案例。

评论

不记名、不需要注册——不要邮箱,不要手机号,不要任何身份信息,填个昵称就能留言。放心说。

  • 加载中 …