Claude Code + DeepSeek 配置详解（国内省钱方案）

📍 入门 4/5 · 上一篇：← 装一个 Claude Code · 下一篇：第一次跟它说话 →

这篇接上一篇

上一篇装一个 Claude Code 你应该已经装好了工具壳子，在 Step 4 简单配过 DeepSeek 把它跑起来。

这一篇深入展开几件事：

环境变量到底每个是干嘛的、还能调什么
DeepSeek 有几个模型，分别什么场景用
跑一天大概花多少钱（实测数据）
DeepSeek 跟 Claude Opus 比，哪些场景体验有差距、要怎么取舍
不想用 DeepSeek？通义 / Kimi / 智谱怎么换

看完这一篇，你对「国内怎么省钱玩 Claude Code」就有完整把握了。

为什么是 DeepSeek

国产模型这么多，为什么这篇拿 DeepSeek 当主线？三个理由：

国内直连最稳。api.deepseek.com 服务器在国内，普通家庭宽带秒级响应，没有「网络环境」这件事要操心。

中文是国产第一档。中文长文档、复杂指令理解、代码生成，DeepSeek 的表现在国内自研模型里排前三。

1M 上下文窗口。DeepSeek V4 系列（deepseek-v4-flash / deepseek-v4-pro）原生支持 1M 上下文，跟 Claude Opus 4.7 一档，能装下大型项目的完整代码 + 文档不在话下。

价格便宜到几乎可以忽略。截至 2026-05，deepseek-v4-flash 的价格是：

输入 token：1 元 / 百万
输出 token：4 元 / 百万

普通人重度跑一整天 Claude Code，token 消耗大概 20-30 万——也就是 0.5 到 1 块钱。一杯豆浆的价钱跑一天。

跟其他几种选择对比：

方案	价格	国内访问	适合谁
DeepSeek API	0.5-1 元/天	直连	国内主力方案
Anthropic Claude Max	$100/月（约 700 元）	需海外网络 + 海外账号	能翻墙 + 重度用户
OpenAI GPT API	DeepSeek 的 10-100 倍	需海外网络	已经在 OpenAI 生态的
通义千问 API	跟 DeepSeek 接近	直连	国内备选
Kimi API	略贵	直连	长上下文场景

环境变量完整配置

「环境变量」是什么——你可以把它想成贴在你电脑桌面上的一张便签:所有打开的程序都能看到。我们要在这张便签上写 3 条:「API 服务器在哪 / 我的 key 是啥 / 用哪个模型」。

Claude Code 启动时会去读这张便签,自动按你写的内容跑——这就是为什么改一行环境变量就能让它从 Anthropic 切到 DeepSeek。

更技术的说法:「环境变量」是写在你系统配置里、所有终端程序都能读到的一组键值对。我们用它告诉 Claude Code:「别去 Anthropic 了,去 DeepSeek,用我的 key,跑这个模型。」

如果你看过上一篇装一个 Claude Code，并且按 Step 4 把变量写到了 ~/.zshrc（Mac/Linux）或 $PROFILE（Windows）——这一节就当作「重新理解每个变量是干嘛、还能调什么」来读，下面的代码块都是你已经写过的。

如果你是直接跳到这一篇——下面的所有 export ... 命令最终都要写到 shell 配置文件里而不是终端直接跑（直接跑只对当前窗口生效，关掉就没了）。

Mac：跑 nano ~/.zshrc 打开配置文件，把代码追加到最底下。打开后大致是这个样子：

nano 编辑 ~/.zshrc 的界面

按 Ctrl+O 然后回车保存，按 Ctrl+X 退出。然后在终端跑 source ~/.zshrc 让配置立即生效。

Linux：跟 Mac 一样，但文件名是 ~/.bashrc。

Windows：跑 notepad $PROFILE 打开配置文件。如果提示文件不存在，选「是」创建。然后把代码粘进去，打开后大致是这样：

保存，关闭所有 PowerShell 窗口，重新开一个让配置生效。

详细步骤（带每一步在终端里长啥样的解释）看 install Step 4。

核心三件套（必填）

export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
export ANTHROPIC_AUTH_TOKEN="sk-你的 DeepSeek API key"
export ANTHROPIC_MODEL="deepseek-v4-flash"

逐个解释：

ANTHROPIC_BASE_URL —— 告诉 Claude Code「API 服务器在哪」。

默认是 https://api.anthropic.com（Anthropic 官方）。我们改成 DeepSeek 提供的「Anthropic 兼容端点」https://api.deepseek.com/anthropic——意思是 DeepSeek 这条路径做了一层翻译，让请求看起来跟 Anthropic 的一样，Claude Code 不需要改任何代码就能切过去。

ANTHROPIC_AUTH_TOKEN —— 你的 API Key。

DeepSeek key 以 sk- 开头，长度 51 个字符左右。千万别把它写到 git 仓库或者公开的文件里——一旦泄漏，别人能用你的 key 烧光你的余额。

ANTHROPIC_MODEL —— 用哪个模型。

默认是 Anthropic 的 claude-sonnet-4-6。我们改成 deepseek-v4-flash（DeepSeek 新主力，速度 + 性价比兼顾）。重活时可以临时切到 deepseek-v4-pro，下一节展开。

可选进阶变量

ANTHROPIC_SMALL_FAST_MODEL —— 给 Claude Code 内部的「轻量任务」用的小模型。

Claude Code 有些场景（比如生成 commit message、给文件起名、内部分类）不需要顶级模型，用小模型更快更省。如果不设，所有任务都走主模型。

export ANTHROPIC_SMALL_FAST_MODEL="deepseek-v4-flash"

DeepSeek 现在的 V4 系列就 flash / pro 两档，没有特别小的，SMALL_FAST_MODEL 也指向 flash 跟主模型一致即可。

CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC —— 禁用非必要遥测请求。

Claude Code 偶尔会请求 Anthropic 的辅助接口（更新检查、统计上报）。国内环境下这些请求会失败 / 慢，加上这条避免影响主流程：

export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1

完整配置示例

把上面整合一起，Mac / Linux 写到 ~/.zshrc 或 ~/.bashrc：

# Claude Code + DeepSeek
export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
export ANTHROPIC_AUTH_TOKEN="sk-你的-key"
export ANTHROPIC_MODEL="deepseek-v4-flash"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek-v4-flash"
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1

Windows PowerShell（写到 $PROFILE）：

$env:ANTHROPIC_BASE_URL = "https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "sk-你的-key"
$env:ANTHROPIC_MODEL = "deepseek-v4-flash"
$env:ANTHROPIC_SMALL_FAST_MODEL = "deepseek-v4-flash"
$env:CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC = "1"

DeepSeek 的模型怎么选

2026-05 更新：DeepSeek 已经发布 V4 系列两个新主力——deepseek-v4-flash 和 deepseek-v4-pro。旧的 deepseek-chat / deepseek-reasoner 还能用，但官方说将来会下线，对应到 deepseek-v4-flash 的两种模式。新装的人直接配 V4 系列。

`deepseek-v4-flash`（轻活主力）

284B 总参数 / 13B 激活参数，速度快、价格低，日常 90% 的场景用它。

特点：

响应快（通常 1-3 秒首 token）
中英文流畅、工具调用稳定
原生支持 1M context
支持 thinking / non-thinking 双模式——开 thinking 它会先内心推理再回答，输出更稳

`deepseek-v4-pro`（重活旗舰）

1.6T 总参数 / 49B 激活参数，对标顶级闭源模型。复杂逻辑、长链 debug、架构设计用它。

特点：

同样原生 1M context + 双模式
输出质量在难题上明显更好
响应慢、token 消耗比 flash 高 2-3 倍

什么时候临时切到 v4-pro：

让它 debug 一个反复改不对的 bug
让它分析一段你看不懂的复杂代码
让它设计一个有 trade-off 的算法 / 架构方案

怎么切：两种方法。

方法 1：改环境变量重启。把 ANTHROPIC_MODEL 改成 deepseek-v4-pro，新开终端跑 claude。

方法 2（推荐）：在 Claude Code 里用 /model 命令，临时切到 pro，问完再切回 flash。不用重启。

> /model deepseek-v4-pro
✓ Switched to deepseek-v4-pro

> 这段递归代码我看了 20 分钟还是不懂栈深度怎么算的，你帮我分析下
[Claude Code 用 v4-pro 回答，开启 thinking 模式]

> /model deepseek-v4-flash
✓ Switched back to deepseek-v4-flash

成本估算 + 实测

你最关心的——一天到底花多少钱？

下面是几个真实场景的 token 估算（实测数据，会因任务复杂度浮动）：

场景	大约 token 数	大约花费
改一个 Python 函数（不到 100 行）	~5,000	0.02 元
让它读一份 50 页 PDF 写摘要	~50,000	0.20 元
让它读整个 10 个文件的小项目 + 改个 feature	~80,000	0.30 元
中度使用一整天（10 个不同任务）	~200,000	0.80 元
频繁使用一周（每天 30+ 任务）	~1,500,000	6 元

数据基于 deepseek-v4-flash 模型，输入按 1 元/百万 token、输出按 4 元/百万 token 估算（截至 2026-05）。v4-pro 比 flash 单价高 2-3 倍，但用得少。实际你账户的「用量」页面可以看真实消耗。

参考线：Claude Max 订阅每月 $100（约 700 元）。DeepSeek 重度跑一个月约 20-30 元，省 95%+。

省钱的代价是什么？看下一节。

DeepSeek 跑 Claude Code 的限制

诚实告知，不忽悠——下面这些是 DeepSeek 路线相比 Claude Opus 的取舍：

用不了的功能

❌ 不支持图片输入：DeepSeek API 目前没有 vision 能力。Claude Code 里那些「让它看截图分析 UI」「让它读图表」的玩法都用不了
❌ 不支持 Computer Use：那是 Claude 独有的「操作你电脑屏幕」能力，DeepSeek 没这层 API
⚠️ 部分高级工具调用偶尔不稳：DeepSeek 的 Anthropic 兼容协议是 2024 末才推出的，跟 Claude 原生比，少数复杂 schema 偶尔会丢字段——再跑一次通常就好

模型能力差距（关键）

日常 80% 的场景——读代码、改 bug、写测试、整理文档、写 commit message——DeepSeek 跟 Claude Opus 的体验差不多，你日常感觉不出明显差距。

少数场景体验会有些差异：

复杂多步推理：deepseek-v4-pro 开 thinking 模式能补一部分，但跟 Claude Opus 的深度思考还有点距离
写作 / 文学场景：Claude 的中文文笔目前国际第一档，DeepSeek 是国产第一档，两者各有侧重，体感因人而异

什么时候应该考虑临时上 Claude Opus

如果你遇到这些情况，可以考虑临时翻墙开个 Anthropic 账号跑一下：

必须分析截图 / 图表 / UI（vision 场景，DeepSeek 没这能力）
必须用 computer use 操作电脑（Claude 独有）
写长篇创作（小说、深度长文），想试一下 Claude 的中文文笔
项目卡了很久，DeepSeek 反复给不出方案，换个模型换个思路

平时还是 DeepSeek 兜底。两边都用是最优解。

不想用 DeepSeek？

主流国产模型大部分也有 Anthropic 兼容端点。选哪家原则：

看 DeepSeek 不爽 / 想试新的：通义千问、Kimi 都成熟
需要超长上下文（128K+）：Kimi
已经在阿里云生态：通义
想接多家自动 failover：用 LLM gateway（litellm proxy 这类）

各家配置原理都一样——改 ANTHROPIC_BASE_URL + ANTHROPIC_AUTH_TOKEN + ANTHROPIC_MODEL。具体端点和模型名各家文档查最新（端点偶尔会调）：

通义千问：阿里云 DashScope 平台
Kimi（月之暗面）：moonshot.cn 平台
智谱 GLM：bigmodel.cn 平台
混合方案 LLM Gateway：用 litellm 这种代理，本地起一个 server，任何模型都能转 Anthropic 协议

后续我们会出一篇专门讲「LLM Gateway 自建：一个配置同时接 5 家国产模型」，敬请关注。

常见问题与坑

按出现频率排：

1. API key 不小心提交到 git 仓库

把 key 写到 ~/.zshrc / $PROFILE（系统级环境变量），不要写到项目里的 .env 文件。

如果一定要项目级配置，确保 .gitignore 里有 .env，并在 DeepSeek 平台立刻删旧 key 建新 key。

2. 报错 rate limit exceeded

DeepSeek 对每个 API key 有 RPM / TPM 限制，账户余额低或者首充用户限制更严。

修：

去 DeepSeek 平台充值提额（一般充到 100 元自动提到高档）
或者临时换其他模型 / 等几分钟

3. 启动后报 unknown model

ANTHROPIC_MODEL 拼写错误，或者填了 DeepSeek 不支持的模型名。

修：用准确的模型名 deepseek-v4-flash / deepseek-v4-pro（或者旧名 deepseek-chat / deepseek-reasoner 也能跑），不要写 chat-v4 之类的简写。

4. 输出被截断

DeepSeek 默认 max_tokens 上限较低（8K），处理长输出可能被截。

修：在 Claude Code 的 ~/.claude/settings.json 加：

{
  "env": {
    "ANTHROPIC_MAX_TOKENS": "16000"
  }
}

5. 国内某些时段 DeepSeek 平台拥塞

DeepSeek 高峰期（晚上 8-11 点）偶尔会响应慢或者 503。这是国产服务的通病，避开高峰或者临时切其他模型。

装好了，下一步看什么

还没装 Claude Code 工具：← 装一个 Claude Code
第一次跟它说话该怎么开口 → 第一次跟它说话

DeepSeek 之外你跑通了通义 / Kimi / 智谱的接入,把配置发邮箱 [email protected],我们会做一篇国内模型对照测评。

不记名、不需要注册——不要邮箱，不要手机号，不要任何身份信息，填个昵称就能留言。放心说。

加载中 …