Claude Code + DeepSeek 配置详解(国内省钱方案)
📍 入门 4/5 · 上一篇:← 装一个 Claude Code · 下一篇:第一次跟它说话 →
这篇接上一篇
Section titled “这篇接上一篇”上一篇 装一个 Claude Code 你应该已经装好了工具壳子,在 Step 4 简单配过 DeepSeek 把它跑起来。
这一篇深入展开几件事:
- 环境变量到底每个是干嘛的、还能调什么
- DeepSeek 有几个模型,分别什么场景用
- 跑一天大概花多少钱(实测数据)
- DeepSeek 跟 Claude Opus 比,哪些场景体验有差距、要怎么取舍
- 不想用 DeepSeek?通义 / Kimi / 智谱怎么换
看完这一篇,你对「国内怎么省钱玩 Claude Code」就有完整把握了。
为什么是 DeepSeek
Section titled “为什么是 DeepSeek”国产模型这么多,为什么这篇拿 DeepSeek 当主线?三个理由:
国内直连最稳。api.deepseek.com 服务器在国内,普通家庭宽带秒级响应,没有「网络环境」这件事要操心。
中文是国产第一档。中文长文档、复杂指令理解、代码生成,DeepSeek 的表现在国内自研模型里排前三。
1M 上下文窗口。DeepSeek V4 系列(deepseek-v4-flash / deepseek-v4-pro)原生支持 1M 上下文,跟 Claude Opus 4.7 一档,能装下大型项目的完整代码 + 文档不在话下。
价格便宜到几乎可以忽略。截至 2026-05,deepseek-v4-flash 的价格是:
- 输入 token:1 元 / 百万
- 输出 token:4 元 / 百万
普通人重度跑一整天 Claude Code,token 消耗大概 20-30 万——也就是 0.5 到 1 块钱。一杯豆浆的价钱跑一天。
跟其他几种选择对比:
| 方案 | 价格 | 国内访问 | 适合谁 |
|---|---|---|---|
| DeepSeek API | 0.5-1 元/天 | 直连 | 国内主力方案 |
| Anthropic Claude Max | $100/月(约 700 元) | 需海外网络 + 海外账号 | 能翻墙 + 重度用户 |
| OpenAI GPT API | DeepSeek 的 10-100 倍 | 需海外网络 | 已经在 OpenAI 生态的 |
| 通义千问 API | 跟 DeepSeek 接近 | 直连 | 国内备选 |
| Kimi API | 略贵 | 直连 | 长上下文场景 |
环境变量完整配置
Section titled “环境变量完整配置”「环境变量」是什么——你可以把它想成贴在你电脑桌面上的一张便签:所有打开的程序都能看到。 我们要在这张便签上写 3 条:「API 服务器在哪 / 我的 key 是啥 / 用哪个模型」。
Claude Code 启动时会去读这张便签,自动按你写的内容跑——这就是为什么改一行环境变量就能让它从 Anthropic 切到 DeepSeek。
更技术的说法:「环境变量」是写在你系统配置里、所有终端程序都能读到的一组键值对。我们用它告诉 Claude Code:「别去 Anthropic 了,去 DeepSeek,用我的 key,跑这个模型。」
核心三件套(必填)
Section titled “核心三件套(必填)”export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"export ANTHROPIC_AUTH_TOKEN="sk-你的 DeepSeek API key"export ANTHROPIC_MODEL="deepseek-v4-flash"逐个解释:
ANTHROPIC_BASE_URL —— 告诉 Claude Code「API 服务器在哪」。
默认是 https://api.anthropic.com(Anthropic 官方)。我们改成 DeepSeek 提供的「Anthropic 兼容端点」https://api.deepseek.com/anthropic——意思是 DeepSeek 这条路径做了一层翻译,让请求看起来跟 Anthropic 的一样,Claude Code 不需要改任何代码就能切过去。
ANTHROPIC_AUTH_TOKEN —— 你的 API Key。
DeepSeek key 以 sk- 开头,长度 51 个字符左右。千万别把它写到 git 仓库或者公开的文件里——一旦泄漏,别人能用你的 key 烧光你的余额。
ANTHROPIC_MODEL —— 用哪个模型。
默认是 Anthropic 的 claude-sonnet-4-6。我们改成 deepseek-v4-flash(DeepSeek 新主力,速度 + 性价比兼顾)。重活时可以临时切到 deepseek-v4-pro,下一节展开。
可选进阶变量
Section titled “可选进阶变量”ANTHROPIC_SMALL_FAST_MODEL —— 给 Claude Code 内部的「轻量任务」用的小模型。
Claude Code 有些场景(比如生成 commit message、给文件起名、内部分类)不需要顶级模型,用小模型更快更省。如果不设,所有任务都走主模型。
export ANTHROPIC_SMALL_FAST_MODEL="deepseek-v4-flash"DeepSeek 现在的 V4 系列就 flash / pro 两档,没有特别小的,
SMALL_FAST_MODEL也指向 flash 跟主模型一致即可。
CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC —— 禁用非必要遥测请求。
Claude Code 偶尔会请求 Anthropic 的辅助接口(更新检查、统计上报)。国内环境下这些请求会失败 / 慢,加上这条避免影响主流程:
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1完整配置示例
Section titled “完整配置示例”把上面整合一起,Mac / Linux 写到 ~/.zshrc 或 ~/.bashrc:
# Claude Code + DeepSeekexport ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"export ANTHROPIC_AUTH_TOKEN="sk-你的-key"export ANTHROPIC_MODEL="deepseek-v4-flash"export ANTHROPIC_SMALL_FAST_MODEL="deepseek-v4-flash"export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1Windows PowerShell(写到 $PROFILE):
$env:ANTHROPIC_BASE_URL = "https://api.deepseek.com/anthropic"$env:ANTHROPIC_AUTH_TOKEN = "sk-你的-key"$env:ANTHROPIC_MODEL = "deepseek-v4-flash"$env:ANTHROPIC_SMALL_FAST_MODEL = "deepseek-v4-flash"$env:CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC = "1"DeepSeek 的模型怎么选
Section titled “DeepSeek 的模型怎么选”2026-05 更新:DeepSeek 已经发布 V4 系列两个新主力——
deepseek-v4-flash和deepseek-v4-pro。旧的deepseek-chat/deepseek-reasoner还能用,但官方说将来会下线,对应到deepseek-v4-flash的两种模式。新装的人直接配 V4 系列。
deepseek-v4-flash(轻活主力)
Section titled “deepseek-v4-flash(轻活主力)”284B 总参数 / 13B 激活参数,速度快、价格低,日常 90% 的场景用它。
特点:
- 响应快(通常 1-3 秒首 token)
- 中英文流畅、工具调用稳定
- 原生支持 1M context
- 支持 thinking / non-thinking 双模式——开 thinking 它会先内心推理再回答,输出更稳
deepseek-v4-pro(重活旗舰)
Section titled “deepseek-v4-pro(重活旗舰)”1.6T 总参数 / 49B 激活参数,对标顶级闭源模型。复杂逻辑、长链 debug、架构设计用它。
特点:
- 同样原生 1M context + 双模式
- 输出质量在难题上明显更好
- 响应慢、token 消耗比 flash 高 2-3 倍
什么时候临时切到 v4-pro:
- 让它 debug 一个反复改不对的 bug
- 让它分析一段你看不懂的复杂代码
- 让它设计一个有 trade-off 的算法 / 架构方案
怎么切:两种方法。
方法 1:改环境变量重启。把 ANTHROPIC_MODEL 改成 deepseek-v4-pro,新开终端跑 claude。
方法 2(推荐):在 Claude Code 里用 /model 命令,临时切到 pro,问完再切回 flash。不用重启。
> /model deepseek-v4-pro✓ Switched to deepseek-v4-pro
> 这段递归代码我看了 20 分钟还是不懂栈深度怎么算的,你帮我分析下[Claude Code 用 v4-pro 回答,开启 thinking 模式]
> /model deepseek-v4-flash✓ Switched back to deepseek-v4-flash成本估算 + 实测
Section titled “成本估算 + 实测”你最关心的——一天到底花多少钱?
下面是几个真实场景的 token 估算(实测数据,会因任务复杂度浮动):
| 场景 | 大约 token 数 | 大约花费 |
|---|---|---|
| 改一个 Python 函数(不到 100 行) | ~5,000 | 0.02 元 |
| 让它读一份 50 页 PDF 写摘要 | ~50,000 | 0.20 元 |
| 让它读整个 10 个文件的小项目 + 改个 feature | ~80,000 | 0.30 元 |
| 中度使用一整天(10 个不同任务) | ~200,000 | 0.80 元 |
| 频繁使用一周(每天 30+ 任务) | ~1,500,000 | 6 元 |
数据基于
deepseek-v4-flash模型,输入按 1 元/百万 token、输出按 4 元/百万 token 估算(截至 2026-05)。v4-pro比 flash 单价高 2-3 倍,但用得少。实际你账户的「用量」页面可以看真实消耗。
参考线:Claude Max 订阅每月 $100(约 700 元)。DeepSeek 重度跑一个月约 20-30 元,省 95%+。
省钱的代价是什么?看下一节。
DeepSeek 跑 Claude Code 的限制
Section titled “DeepSeek 跑 Claude Code 的限制”诚实告知,不忽悠——下面这些是 DeepSeek 路线相比 Claude Opus 的取舍:
用不了的功能
Section titled “用不了的功能”- ❌ 不支持图片输入:DeepSeek API 目前没有 vision 能力。Claude Code 里那些「让它看截图分析 UI」「让它读图表」的玩法都用不了
- ❌ 不支持 Computer Use:那是 Claude 独有的「操作你电脑屏幕」能力,DeepSeek 没这层 API
- ⚠️ 部分高级工具调用偶尔不稳:DeepSeek 的 Anthropic 兼容协议是 2024 末才推出的,跟 Claude 原生比,少数复杂 schema 偶尔会丢字段——再跑一次通常就好
模型能力差距(关键)
Section titled “模型能力差距(关键)”日常 80% 的场景——读代码、改 bug、写测试、整理文档、写 commit message——DeepSeek 跟 Claude Opus 的体验差不多,你日常感觉不出明显差距。
少数场景体验会有些差异:
- 复杂多步推理:
deepseek-v4-pro开 thinking 模式能补一部分,但跟 Claude Opus 的深度思考还有点距离 - 写作 / 文学场景:Claude 的中文文笔目前国际第一档,DeepSeek 是国产第一档,两者各有侧重,体感因人而异
什么时候应该考虑临时上 Claude Opus
Section titled “什么时候应该考虑临时上 Claude Opus”如果你遇到这些情况,可以考虑临时翻墙开个 Anthropic 账号跑一下:
- 必须分析截图 / 图表 / UI(vision 场景,DeepSeek 没这能力)
- 必须用 computer use 操作电脑(Claude 独有)
- 写长篇创作(小说、深度长文),想试一下 Claude 的中文文笔
- 项目卡了很久,DeepSeek 反复给不出方案,换个模型换个思路
平时还是 DeepSeek 兜底。两边都用是最优解。
不想用 DeepSeek?
Section titled “不想用 DeepSeek?”主流国产模型大部分也有 Anthropic 兼容端点。选哪家原则:
- 看 DeepSeek 不爽 / 想试新的:通义千问、Kimi 都成熟
- 需要超长上下文(128K+):Kimi
- 已经在阿里云生态:通义
- 想接多家自动 failover:用 LLM gateway(litellm proxy 这类)
各家配置原理都一样——改 ANTHROPIC_BASE_URL + ANTHROPIC_AUTH_TOKEN + ANTHROPIC_MODEL。具体端点和模型名各家文档查最新(端点偶尔会调):
- 通义千问:阿里云 DashScope 平台
- Kimi(月之暗面):moonshot.cn 平台
- 智谱 GLM:bigmodel.cn 平台
- 混合方案 LLM Gateway:用 litellm 这种代理,本地起一个 server,任何模型都能转 Anthropic 协议
后续我们会出一篇专门讲「LLM Gateway 自建:一个配置同时接 5 家国产模型」,敬请关注。
常见问题与坑
Section titled “常见问题与坑”按出现频率排:
1. API key 不小心提交到 git 仓库
把 key 写到 ~/.zshrc / $PROFILE(系统级环境变量),不要写到项目里的 .env 文件。
如果一定要项目级配置,确保 .gitignore 里有 .env,并在 DeepSeek 平台立刻删旧 key 建新 key。
2. 报错 rate limit exceeded
DeepSeek 对每个 API key 有 RPM / TPM 限制,账户余额低或者首充用户限制更严。
修:
- 去 DeepSeek 平台充值提额(一般充到 100 元自动提到高档)
- 或者临时换其他模型 / 等几分钟
3. 启动后报 unknown model
ANTHROPIC_MODEL 拼写错误,或者填了 DeepSeek 不支持的模型名。
修:用准确的模型名 deepseek-v4-flash / deepseek-v4-pro(或者旧名 deepseek-chat / deepseek-reasoner 也能跑),不要写 chat-v4 之类的简写。
4. 输出被截断
DeepSeek 默认 max_tokens 上限较低(8K),处理长输出可能被截。
修:在 Claude Code 的 ~/.claude/settings.json 加:
{ "env": { "ANTHROPIC_MAX_TOKENS": "16000" }}5. 国内某些时段 DeepSeek 平台拥塞
DeepSeek 高峰期(晚上 8-11 点)偶尔会响应慢或者 503。这是国产服务的通病,避开高峰或者临时切其他模型。
装好了,下一步看什么
Section titled “装好了,下一步看什么”- 还没装 Claude Code 工具:← 装一个 Claude Code
- 第一次跟它说话该怎么开口 → 第一次跟它说话
DeepSeek 之外你跑通了通义 / Kimi / 智谱的接入,把配置发邮箱 [email protected],我们会做一篇国内模型对照测评。
评论
不记名、不需要注册——不要邮箱,不要手机号,不要任何身份信息,填个昵称就能留言。放心说。