LLM 提供商指南¶
TFRobot 支持多家主流 LLM 提供商,每个提供商都有其独特的特性和最佳实践。
提供商列表¶
| 提供商 | 类名 | 最新模型 | 工具调用 | 多模态 | 特色功能 |
|---|---|---|---|---|---|
| OpenAI | GPT, GPTWithTools |
GPT-5.2, GPT-4o, GPT-4.1 | ✅ | ✅ | 最强通用能力、GPT-5.2突破90%ARC-AGI、400K上下文 |
| Anthropic | Claude |
Claude Opus 4.5, Claude 3.5/4.5 Sonnet | ✅ | ✅ | 最强推理、Opus 4.5旗舰级性能 |
Gemini, GeminiWithTools |
Gemini 3 Pro/Flash, Gemini 2.0 Flash | ✅ | ✅ | 1M超长上下文、混合推理、极低价格 | |
| DeepSeek | DeepSeek, DeepSeekWithTools |
deepseek-chat, deepseek-reasoner | ✅ | ❌ | 性能强劲、性价比极高、纯文本 |
| 智谱 AI | GLM, GLMWithTools |
GLM-4.7, GLM-4.5 | ✅ | ✅ | 中文优化、代码生成开源第一、思考模式 |
| 阿里云 | DashScope, DashScopeWithTools |
qwen-max-2025-01-25, Qwen3-Max | ✅ | ✅ | 国产旗舰、降价88% |
| Ollama | Ollama, OllamaWithTools |
llama3, mistral | ✅ | ⚠️ | 本地部署、数据隐私 |
快速选择¶
按场景选择¶
| 场景 | 推荐提供商 | 推荐模型 | 理由 |
|---|---|---|---|
| 通用对话 | DeepSeek/OpenAI | deepseek-chat / gpt-5.2-instant |
DS性价比极高,GPT-5.2性能最强 |
| 复杂推理 | Anthropic | claude-opus-4.5 |
业界最强推理能力,Opus 4.5旗舰级 |
| 超长上下文 | gemini-3-pro |
1M上下文,混合推理,价格合理 | |
| 多模态任务 | OpenAI | gpt-5.2 |
首破90% ARC-AGI,400K上下文 |
| 代码生成 | 智谱AI | glm-4.7 |
开源代码生成第一,媲美Claude 3.5 |
| 中文场景 | DeepSeek | deepseek-chat |
性能接近GPT-5,价格仅为1/200 |
| 本地部署 | Ollama | llama3 |
数据隐私,无网络依赖 |
按特性选择¶
| 特性需求 | 推荐提供商 | 模型示例 |
|---|---|---|
| 最长上下文 | Google, Anthropic, OpenAI | Gemini 3 Pro (1M), Claude 4.5 (1M), GPT-5.2 (400K) |
| 最强推理 | Anthropic, OpenAI | Claude Opus 4.5, GPT-5.2 |
| 最佳代码生成 | 智谱AI, Anthropic | GLM-4.7 (开源第一), Claude Opus 4.5 |
| 最佳性价比 | DeepSeek, Google | deepseek-chat (¥1/M), Gemini 3 Flash |
| 混合推理 | Google, 智谱AI | Gemini 3 Pro (思考预算), GLM-4.7 (思考模式) |
| 视频理解 | Gemini 3 Pro | |
| 图片分析 | OpenAI, Anthropic, 智谱AI | GPT-5.2, Claude Opus 4.5, GLM-4V |
| 音频处理 | OpenAI | GPT-5.2, GPT-4o |
| 中文优化 | DeepSeek, 智谱AI | deepseek-chat, GLM-4.7 |
| 数据隐私 | Ollama | 本地部署模型 |
提供商快速入口¶
| 提供商 | 类名 | 使用指南 | API 参考 | 核心特色 |
|---|---|---|---|---|
| OpenAI | GPT, GPTWithTools |
详细指南 | API 参考 | 最强通用能力、GPT-5.2突破90%ARC-AGI |
| Anthropic | Claude |
详细指南 | - | 最强推理、Opus 4.5旗舰级性能 |
Gemini, GeminiWithTools |
详细指南 | - | 1M超长上下文、混合推理、价格合理 | |
| DeepSeek | DeepSeek, DeepSeekWithTools |
详细指南 | - | 性能强劲、性价比极高、纯文本 |
| 智谱 AI | GLM, GLMWithTools |
详细指南 | - | 中文优化、GLM-4.7代码生成开源第一 |
| 阿里云 | DashScope, DashScopeWithTools |
详细指南 | - | 国产旗舰、降价88% |
| Ollama | Ollama, OllamaWithTools |
详细指南 | - | 本地部署、数据隐私 |
配置 API 密钥¶
环境变量配置¶
# OpenAI
export OPENAI_API_KEY="sk-..."
# Anthropic
export ANTHROPIC_API_KEY="sk-ant-..."
# Google
export GOOGLE_API_KEY="..."
# DeepSeek
export DEEPSEEK_API_KEY="sk-..."
# 智谱 AI
export ZHIPUAI_API_KEY="..."
# 阿里云
export DASHSCOPE_API_KEY="sk-..."
代码中配置¶
from tfrobot.brain.chain.llms import GPT
llm = GPT(
name="gpt-4o",
openai_api_key="sk-..." # 不推荐,优先使用环境变量
)
通用最佳实践¶
1. 错误处理¶
所有提供商都应正确处理上下文超长错误:
from tfrobot.schema.exceptions import ContextTooLargeError
try:
result = llm.complete(current_input=user_input)
except ContextTooLargeError as e:
# Chain 层会自动触发压缩
# 或者手动处理
print(f"上下文超长: {e.current_size} > {e.target_size}")
2. 重试机制¶
内置重试机制已配置,处理以下异常: - 网络超时 - 连接错误 - API 限流
# 默认配置:最多重试 3 次,指数退避
# 可在子类中自定义
3. 成本优化¶
# 设置价格(用于计费统计)
llm = GPT(
name="gpt-4o",
input_price=0.005, # 5美元/百万tokens
output_price=0.015 # 15美元/百万tokens
)
4. 多模态支持¶
from tfrobot.schema.message.conversation.message_dto import MultiPartMessage
# 支持图片、视频、音频、PDF
msg = MultiPartMessage(content=[
TextPart(text="分析这个文件"),
ImagePart(image_url=ImgUrl(url="path/to/image.jpg")),
VideoPart(video_url=VideoUrl(url="path/to/video.mp4")),
])
性能对比(2025年最新)¶
主流模型对比表¶
🏆 顶级旗舰模型(2025年末最新)¶
| 模型 | 上下文 | 输入价格 | 输出价格 | 推理 | 工具调用 | 中文 | 多模态 | 发布时间 |
|---|---|---|---|---|---|---|---|---|
| GPT-5.2 | 400K | ¥12.6/M | ¥100.8/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ✅ | 2025.12 |
| Claude Opus 4.5 | 200K | ¥36/M | ¥180/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ✅ | 2025.11 |
| Gemini 3 Pro | 1M | ¥14.4-28.8/M | ¥86.4-129.6/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ | 2025.01 |
| GLM-4.7 | 200K | ¥4.3/M | ¥15.8/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ✅ | 2025.12 |
💪 高性能主流模型¶
| 模型 | 上下文 | 输入价格 | 输出价格 | 推理 | 工具调用 | 中文 | 多模态 |
|---|---|---|---|---|---|---|---|
| GPT-4o | 128K | ¥18/M | ¥72/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ |
| GPT-4.1 | 1M | ¥14/M | - | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ |
| Claude 3.5 Sonnet | 200K | ¥21.6/M | ¥108/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ |
| Claude 4.5 Sonnet | 1M | ¥21.6/M | ¥108/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ |
💰 高性价比模型¶
| 模型 | 上下文 | 输入价格 | 输出价格 | 推理 | 工具调用 | 中文 | 多模态 |
|---|---|---|---|---|---|---|---|
| Gemini 3 Flash | 1M | ¥3.6/M | ¥21.6/M | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ |
| Gemini 2.0 Flash | 1M | ¥0.72/M | ¥2.9/M | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ |
| DeepSeek-Chat | 128K | ¥1/M | ¥2/M | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ❌ |
| DeepSeek-Reasoner | 128K | ¥4/M | ¥15.7/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ❌ |
| GLM-4.5 | 128K | ¥0.8/M | ¥2/M | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ✅ |
| Qwen-Max | 131K | ¥2.4/M | ¥9.6/M | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ✅ |
💡 价格说明: - 价格基于2025年官方最新定价 - 汇率按 $1 ≈ ¥7.2 计算 - 部分模型提供缓存折扣(如GPT-4o缓存价格¥2.1/M) - 实际价格可能因使用量、缓存等因素有所不同
推荐使用场景¶
🚀 旗舰性能(预算充足,追求极致): 1. GPT-5.2 - 首破90% ARC-AGI,最强通用能力,400K上下文 2. Claude Opus 4.5 - 业界最强推理能力,旗舰级性能 3. Gemini 3 Pro - 1M上下文 + 混合推理,适合超长文档分析 4. GLM-4.7 - 代码生成开源第一,支持思考模式,¥20/月起
💰 性价比优先(预算有限): 1. DeepSeek-Chat - 性能接近GPT-5,价格极低(¥1/M输入) 2. Gemini 2.0 Flash - 1M上下文,价格最低(¥0.72/M输入) 3. GLM-4.5 - 性能均衡,价格适中(¥0.8/M输入)
🇨🇳 中文场景: 1. DeepSeek-Chat - 性价比最高,中文优化 2. GLM-4.7 - 代码生成能力强劲,支持思考模式 3. Qwen-Max - 国产旗舰,降价后极具竞争力
💻 代码生成: 1. GLM-4.7 - WebDev排行榜开源第一,媲美Claude 3.5 2. Claude Opus 4.5 - SWE-bench 80.9%得分,最强代码生成 3. GPT-5.2 - 专为编程和Agent任务优化
下一步¶
- 自定义 LLM 封装 - 如何扩展支持新的 LLM 提供商
- BaseLLM 基类详解 - 深入了解 LLM 架构设计
- ChatLLM 对话模型 - 掌握 Prompt 位置系统