DeepSeek 使用指南¶
DeepSeek 提供了强大且高性价比的大语言模型,在多项基准测试中不亚于 GPT-4.5,在中文场景下表现尤其优异。
核心优势: - 性能强劲:DeepSeek-V3 在多项测试中接近甚至超越 GPT-4.5 水平 - 性价比极高:价格约为 GPT-4 的 1/200 - 中文优化:对中文场景有专门优化,理解能力强
使用限制: - 纯文本模型:当前版本仅支持文本输入,不支持图片、视频、音频等多模态内容 - 如果没有多模态需求,完全可以使用 DeepSeek 作为主力模型替代 GPT
模型概览¶
推荐模型¶
| 模型 | 上下文 | 特色 | 适用场景 |
|---|---|---|---|
| deepseek-chat | 128K | 性能强劲、性价比极高 | 中文对话、日常任务、文档处理 |
| deepseek-reasoner | 128K | 推理能力强、深度思考 | 复杂推理、数学问题、代码分析 |
模型选择建议¶
from tfrobot.brain.chain.llms import DeepSeek
# 通用场景(推荐)
llm = DeepSeek(name="deepseek-chat")
# 复杂推理任务
llm = DeepSeek(name="deepseek-reasoner")
配置参数¶
from tfrobot.brain.chain.llms import DeepSeek
llm = DeepSeek(
name="deepseek-chat",
temperature=0.7,
max_tokens=4096,
top_p=1.0,
stream=False,
)
特色功能¶
强大性能¶
DeepSeek-V3 在多项基准测试中表现出色,在编程、数学、推理等任务上接近 GPT-4.5 水平,而在中文任务上甚至更有优势。
极高性价比¶
DeepSeek 的价格远低于主流模型(约为 GPT-4 的 1/200):
llm = DeepSeek(
name="deepseek-chat",
# 输入:$0.14/百万tokens(约¥1/百万tokens)
# 输出:$0.28/百万tokens(约¥2/百万tokens)
)
中文优化¶
llm = DeepSeek(
name="deepseek-chat",
locale=Locale.ZH # 内部提示使用中文
)