Skip to content

DeepSeek 使用指南

DeepSeek 提供了强大且高性价比的大语言模型,在多项基准测试中不亚于 GPT-4.5,在中文场景下表现尤其优异。

核心优势: - 性能强劲:DeepSeek-V3 在多项测试中接近甚至超越 GPT-4.5 水平 - 性价比极高:价格约为 GPT-4 的 1/200 - 中文优化:对中文场景有专门优化,理解能力强

使用限制: - 纯文本模型:当前版本仅支持文本输入,不支持图片、视频、音频等多模态内容 - 如果没有多模态需求,完全可以使用 DeepSeek 作为主力模型替代 GPT

模型概览

推荐模型

模型 上下文 特色 适用场景
deepseek-chat 128K 性能强劲、性价比极高 中文对话、日常任务、文档处理
deepseek-reasoner 128K 推理能力强、深度思考 复杂推理、数学问题、代码分析

模型选择建议

from tfrobot.brain.chain.llms import DeepSeek

# 通用场景(推荐)
llm = DeepSeek(name="deepseek-chat")

# 复杂推理任务
llm = DeepSeek(name="deepseek-reasoner")

配置参数

from tfrobot.brain.chain.llms import DeepSeek

llm = DeepSeek(
    name="deepseek-chat",
    temperature=0.7,
    max_tokens=4096,
    top_p=1.0,
    stream=False,
)

特色功能

强大性能

DeepSeek-V3 在多项基准测试中表现出色,在编程、数学、推理等任务上接近 GPT-4.5 水平,而在中文任务上甚至更有优势。

极高性价比

DeepSeek 的价格远低于主流模型(约为 GPT-4 的 1/200):

llm = DeepSeek(
    name="deepseek-chat",
    # 输入:$0.14/百万tokens(约¥1/百万tokens)
    # 输出:$0.28/百万tokens(约¥2/百万tokens)
)

中文优化

llm = DeepSeek(
    name="deepseek-chat",
    locale=Locale.ZH  # 内部提示使用中文
)

相关文档