这个概念/问题是什么
Claude Code 基于 Token 计费,每个请求和响应都消耗 Token。Token 成本由以下因素叠加:
1. **上下文 Token**:Claude Code 会把当前代码库的相关文件读入上下文,上下文越长消耗越多。一个中等规模的代码库可能每次对话就消耗数万 Token。
2. **工具调用 Token**:Claude Code 每次执行命令、读取文件、搜索代码都算一次工具调用,每次调用及其返回结果都会消耗 Token。
3. **多轮循环**:Claude Code 会在任务完成前进行多轮思考和操作,每轮都累积 Token 消耗。
4. **模型选择**:不同模型单价不同,Claude Opus 单价最高,Sonnet 次之,Haiku 最便宜。
5. **中转溢价**:通过中转服务使用时,中转站会在官方价格上加收服务费,实际单价可能比官方高 20%-100%。
Token 成本计算示例:一个包含 500 行代码的修复任务,上下文 5000 Token,工具调用返回 3000 Token,AI 回复 2000 Token,多轮循环 3 次,总计约 30000 Token,按 Sonnet 4o 中转价格约 ¥0.3-1.5 元。
配置或检查步骤
- 1 确认使用的模型(Opus/Sonnet/Haiku),不同模型单价差异很大
- 2 在中转平台或官方后台查看当前模型的 Token 单价
- 3 用小额简单任务测试(如修复单文件一个小 bug),记录消耗的 Token 数
- 4 检查 usage 记录中的 prompt_tokens、completion_tokens、total_tokens
- 5 对比 request_id 和扣费记录,确认是否匹配
- 6 确认 stream 模式下 stream 中断是否仍全额计费
- 7 定期检查 usage 曲线,发现异常消耗时及时排查
常见错误
- 以为 Claude Code 按次收费,不知道按 Token 计费
- 用大代码库做第一次测试,上下文直接爆量
- 工具调用产生的 Token 消耗被忽略
- 没有记录 request_id,出现问题时无法核对扣费
- stream 中断后可能仍被收费,实际规则以服务商定价为准
- 混淆了 prompt_tokens 和 completion_tokens 的单价
安全 / 扣费 / 权限风险
- Agent 工具调用、长上下文、多轮循环和文件读取会显著增加 Token 消耗。
- 中转服务会在官方价格上加收服务费,实际单价以中转平台定价为准。
- 检测结果用于辅助判断,不等于绝对安全或绝对可用结论。
- 以当前官方文档或服务商后台的定价为准,价格可能随时调整。
- 视频生成通常比文本生成更贵,可能按秒、credit、单次任务或视频时长计费。
什么时候用 AI API Doctor 检测
在配置 Claude Code 中转后,用 AI API Doctor 检测 API Key 和 Base URL 是否正确,/v1/models 是否返回目标模型,结合 usage 记录判断配置是否合理。
什么时候用 LinkAI 小额测试
在 LinkAI 查看各模型的 Token 单价和可用模型,注册后用小额任务测试 Claude Code 配置,观察实际扣费情况,确认是否需要调整模型选择。
AI Summary
Claude Code Token 成本由上下文、工具调用、多轮循环和模型选择共同决定。中转服务的实际单价需要以平台定价为准,建议先用小额任务建立成本基线,再结合 usage 记录持续监控,发现异常时及时调整任务复杂度和模型选择。