跳转到内容

Claude Code + DeepSeek 配置详解(国内省钱方案)

📍 入门 4/5 · 上一篇:← 装一个 Claude Code · 下一篇:第一次跟它说话 →

上一篇 装一个 Claude Code 你应该已经装好了工具壳子,在 Step 4 简单配过 DeepSeek 把它跑起来。

这一篇深入展开几件事:

  • 环境变量到底每个是干嘛的、还能调什么
  • DeepSeek 有几个模型,分别什么场景用
  • 跑一天大概花多少钱(实测数据)
  • DeepSeek 跟 Claude Opus 比,哪些场景体验有差距、要怎么取舍
  • 不想用 DeepSeek?通义 / Kimi / 智谱怎么换

看完这一篇,你对「国内怎么省钱玩 Claude Code」就有完整把握了。

国产模型这么多,为什么这篇拿 DeepSeek 当主线?三个理由:

国内直连最稳api.deepseek.com 服务器在国内,普通家庭宽带秒级响应,没有「网络环境」这件事要操心。

中文是国产第一档。中文长文档、复杂指令理解、代码生成,DeepSeek 的表现在国内自研模型里排前三。

1M 上下文窗口。DeepSeek V4 系列(deepseek-v4-flash / deepseek-v4-pro)原生支持 1M 上下文,跟 Claude Opus 4.7 一档,能装下大型项目的完整代码 + 文档不在话下。

价格便宜到几乎可以忽略。截至 2026-05,deepseek-v4-flash 的价格是:

  • 输入 token:1 元 / 百万
  • 输出 token:4 元 / 百万

普通人重度跑一整天 Claude Code,token 消耗大概 20-30 万——也就是 0.5 到 1 块钱。一杯豆浆的价钱跑一天。

跟其他几种选择对比:

方案价格国内访问适合谁
DeepSeek API0.5-1 元/天直连国内主力方案
Anthropic Claude Max$100/月(约 700 元)需海外网络 + 海外账号能翻墙 + 重度用户
OpenAI GPT APIDeepSeek 的 10-100 倍需海外网络已经在 OpenAI 生态的
通义千问 API跟 DeepSeek 接近直连国内备选
Kimi API略贵直连长上下文场景

「环境变量」是什么——你可以把它想成贴在你电脑桌面上的一张便签:所有打开的程序都能看到。 我们要在这张便签上写 3 条:「API 服务器在哪 / 我的 key 是啥 / 用哪个模型」。

Claude Code 启动时会去读这张便签,自动按你写的内容跑——这就是为什么改一行环境变量就能让它从 Anthropic 切到 DeepSeek。

更技术的说法:「环境变量」是写在你系统配置里、所有终端程序都能读到的一组键值对。我们用它告诉 Claude Code:「别去 Anthropic 了,去 DeepSeek,用我的 key,跑这个模型。」

Terminal window
export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
export ANTHROPIC_AUTH_TOKEN="sk-你的 DeepSeek API key"
export ANTHROPIC_MODEL="deepseek-v4-flash"

逐个解释:

ANTHROPIC_BASE_URL —— 告诉 Claude Code「API 服务器在哪」。

默认是 https://api.anthropic.com(Anthropic 官方)。我们改成 DeepSeek 提供的「Anthropic 兼容端点」https://api.deepseek.com/anthropic——意思是 DeepSeek 这条路径做了一层翻译,让请求看起来跟 Anthropic 的一样,Claude Code 不需要改任何代码就能切过去。

ANTHROPIC_AUTH_TOKEN —— 你的 API Key。

DeepSeek key 以 sk- 开头,长度 51 个字符左右。千万别把它写到 git 仓库或者公开的文件里——一旦泄漏,别人能用你的 key 烧光你的余额。

ANTHROPIC_MODEL —— 用哪个模型。

默认是 Anthropic 的 claude-sonnet-4-6。我们改成 deepseek-v4-flash(DeepSeek 新主力,速度 + 性价比兼顾)。重活时可以临时切到 deepseek-v4-pro,下一节展开。

ANTHROPIC_SMALL_FAST_MODEL —— 给 Claude Code 内部的「轻量任务」用的小模型。

Claude Code 有些场景(比如生成 commit message、给文件起名、内部分类)不需要顶级模型,用小模型更快更省。如果不设,所有任务都走主模型。

Terminal window
export ANTHROPIC_SMALL_FAST_MODEL="deepseek-v4-flash"

DeepSeek 现在的 V4 系列就 flash / pro 两档,没有特别小的,SMALL_FAST_MODEL 也指向 flash 跟主模型一致即可。

CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC —— 禁用非必要遥测请求。

Claude Code 偶尔会请求 Anthropic 的辅助接口(更新检查、统计上报)。国内环境下这些请求会失败 / 慢,加上这条避免影响主流程:

Terminal window
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1

把上面整合一起,Mac / Linux 写到 ~/.zshrc~/.bashrc

Terminal window
# Claude Code + DeepSeek
export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
export ANTHROPIC_AUTH_TOKEN="sk-你的-key"
export ANTHROPIC_MODEL="deepseek-v4-flash"
export ANTHROPIC_SMALL_FAST_MODEL="deepseek-v4-flash"
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1

Windows PowerShell(写到 $PROFILE):

Terminal window
$env:ANTHROPIC_BASE_URL = "https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN = "sk-你的-key"
$env:ANTHROPIC_MODEL = "deepseek-v4-flash"
$env:ANTHROPIC_SMALL_FAST_MODEL = "deepseek-v4-flash"
$env:CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC = "1"

2026-05 更新:DeepSeek 已经发布 V4 系列两个新主力——deepseek-v4-flashdeepseek-v4-pro。旧的 deepseek-chat / deepseek-reasoner 还能用,但官方说将来会下线,对应到 deepseek-v4-flash 的两种模式。新装的人直接配 V4 系列

284B 总参数 / 13B 激活参数,速度快、价格低,日常 90% 的场景用它。

特点:

  • 响应快(通常 1-3 秒首 token)
  • 中英文流畅、工具调用稳定
  • 原生支持 1M context
  • 支持 thinking / non-thinking 双模式——开 thinking 它会先内心推理再回答,输出更稳

1.6T 总参数 / 49B 激活参数,对标顶级闭源模型。复杂逻辑、长链 debug、架构设计用它。

特点:

  • 同样原生 1M context + 双模式
  • 输出质量在难题上明显更好
  • 响应慢、token 消耗比 flash 高 2-3 倍

什么时候临时切到 v4-pro

  • 让它 debug 一个反复改不对的 bug
  • 让它分析一段你看不懂的复杂代码
  • 让它设计一个有 trade-off 的算法 / 架构方案

怎么切:两种方法。

方法 1:改环境变量重启。把 ANTHROPIC_MODEL 改成 deepseek-v4-pro,新开终端跑 claude

方法 2(推荐):在 Claude Code 里用 /model 命令,临时切到 pro,问完再切回 flash。不用重启。

> /model deepseek-v4-pro
✓ Switched to deepseek-v4-pro
> 这段递归代码我看了 20 分钟还是不懂栈深度怎么算的,你帮我分析下
[Claude Code 用 v4-pro 回答,开启 thinking 模式]
> /model deepseek-v4-flash
✓ Switched back to deepseek-v4-flash

你最关心的——一天到底花多少钱?

下面是几个真实场景的 token 估算(实测数据,会因任务复杂度浮动):

场景大约 token 数大约花费
改一个 Python 函数(不到 100 行)~5,0000.02 元
让它读一份 50 页 PDF 写摘要~50,0000.20 元
让它读整个 10 个文件的小项目 + 改个 feature~80,0000.30 元
中度使用一整天(10 个不同任务)~200,0000.80 元
频繁使用一周(每天 30+ 任务)~1,500,0006 元

数据基于 deepseek-v4-flash 模型,输入按 1 元/百万 token、输出按 4 元/百万 token 估算(截至 2026-05)。v4-pro 比 flash 单价高 2-3 倍,但用得少。实际你账户的「用量」页面可以看真实消耗。

参考线:Claude Max 订阅每月 $100(约 700 元)。DeepSeek 重度跑一个月约 20-30 元,省 95%+

省钱的代价是什么?看下一节。

诚实告知,不忽悠——下面这些是 DeepSeek 路线相比 Claude Opus 的取舍:

  • ❌ 不支持图片输入:DeepSeek API 目前没有 vision 能力。Claude Code 里那些「让它看截图分析 UI」「让它读图表」的玩法都用不了
  • ❌ 不支持 Computer Use:那是 Claude 独有的「操作你电脑屏幕」能力,DeepSeek 没这层 API
  • ⚠️ 部分高级工具调用偶尔不稳:DeepSeek 的 Anthropic 兼容协议是 2024 末才推出的,跟 Claude 原生比,少数复杂 schema 偶尔会丢字段——再跑一次通常就好

日常 80% 的场景——读代码、改 bug、写测试、整理文档、写 commit message——DeepSeek 跟 Claude Opus 的体验差不多,你日常感觉不出明显差距。

少数场景体验会有些差异:

  • 复杂多步推理deepseek-v4-pro 开 thinking 模式能补一部分,但跟 Claude Opus 的深度思考还有点距离
  • 写作 / 文学场景:Claude 的中文文笔目前国际第一档,DeepSeek 是国产第一档,两者各有侧重,体感因人而异

什么时候应该考虑临时上 Claude Opus

Section titled “什么时候应该考虑临时上 Claude Opus”

如果你遇到这些情况,可以考虑临时翻墙开个 Anthropic 账号跑一下:

  • 必须分析截图 / 图表 / UI(vision 场景,DeepSeek 没这能力)
  • 必须用 computer use 操作电脑(Claude 独有)
  • 写长篇创作(小说、深度长文),想试一下 Claude 的中文文笔
  • 项目卡了很久,DeepSeek 反复给不出方案,换个模型换个思路

平时还是 DeepSeek 兜底。两边都用是最优解

主流国产模型大部分也有 Anthropic 兼容端点。选哪家原则

  • 看 DeepSeek 不爽 / 想试新的:通义千问、Kimi 都成熟
  • 需要超长上下文(128K+):Kimi
  • 已经在阿里云生态:通义
  • 想接多家自动 failover:用 LLM gateway(litellm proxy 这类)

各家配置原理都一样——改 ANTHROPIC_BASE_URL + ANTHROPIC_AUTH_TOKEN + ANTHROPIC_MODEL。具体端点和模型名各家文档查最新(端点偶尔会调):

  • 通义千问:阿里云 DashScope 平台
  • Kimi(月之暗面):moonshot.cn 平台
  • 智谱 GLM:bigmodel.cn 平台
  • 混合方案 LLM Gateway:用 litellm 这种代理,本地起一个 server,任何模型都能转 Anthropic 协议

后续我们会出一篇专门讲「LLM Gateway 自建:一个配置同时接 5 家国产模型」,敬请关注。

按出现频率排:

1. API key 不小心提交到 git 仓库

把 key 写到 ~/.zshrc / $PROFILE(系统级环境变量),不要写到项目里的 .env 文件。

如果一定要项目级配置,确保 .gitignore 里有 .env,并在 DeepSeek 平台立刻删旧 key 建新 key。

2. 报错 rate limit exceeded

DeepSeek 对每个 API key 有 RPM / TPM 限制,账户余额低或者首充用户限制更严。

修:

  • 去 DeepSeek 平台充值提额(一般充到 100 元自动提到高档)
  • 或者临时换其他模型 / 等几分钟

3. 启动后报 unknown model

ANTHROPIC_MODEL 拼写错误,或者填了 DeepSeek 不支持的模型名。

修:用准确的模型名 deepseek-v4-flash / deepseek-v4-pro(或者旧名 deepseek-chat / deepseek-reasoner 也能跑),不要写 chat-v4 之类的简写。

4. 输出被截断

DeepSeek 默认 max_tokens 上限较低(8K),处理长输出可能被截。

修:在 Claude Code 的 ~/.claude/settings.json 加:

{
"env": {
"ANTHROPIC_MAX_TOKENS": "16000"
}
}

5. 国内某些时段 DeepSeek 平台拥塞

DeepSeek 高峰期(晚上 8-11 点)偶尔会响应慢或者 503。这是国产服务的通病,避开高峰或者临时切其他模型。


DeepSeek 之外你跑通了通义 / Kimi / 智谱的接入,把配置发邮箱 [email protected],我们会做一篇国内模型对照测评。

评论

不记名、不需要注册——不要邮箱,不要手机号,不要任何身份信息,填个昵称就能留言。放心说。

  • 加载中 …