DeepSeek V4 Pro 刚刚发布——AI 代理有哪些变化
发布: (2026年4月25日 GMT+8 11:10)
2 分钟阅读
原文: Dev.to
Source: Dev.to
概览
DeepSeek V4 Pro 于 2026 年 4 月 24 日发布,并已在生产环境的智能体中运行。它引入了双模式架构(思考 / 非思考),并支持高达 100 万 token 的上下文窗口,使大规模长上下文任务成为可能。
规格
| 功能 | 详情 |
|---|---|
| 总参数量 | 1.6 T(混合专家) |
| 活跃参数量 | 49 B |
| 上下文窗口 | 1 M token(已验证) |
| 模式 | 思考 / 非思考 双模式 |
| 许可证 | MIT |
| 定价 | $1.74 / 1M 输入,$3.48 / 1M 输出 |
使用示例
# Python example using the NVIDIA NIM endpoint
client = OpenAI(
base_url="https://integrate.api.nvidia.com/v1",
api_key=""
)
response = client.chat.completions.create(
model="deepseek-ai/deepseek-v4-pro",
messages=[...]
)
性能亮点
- 长上下文任务:能够高效处理完整的对话日志。
- 思考模式:每次请求 8–15 秒,提供显著优于 V3 的多步规划能力。
- 非思考模式:每次请求约 2 秒,足以满足高吞吐量内容流水线的需求。
- 函数调用:比 V3.2 更加可靠。
定价对比
| 模型 | 输入 ($/1M) | 输出 ($/1M) |
|---|---|---|
| DeepSeek V4 Pro | $1.74 | $3.48 |
| Claude Sonnet 4.6 | $3.00 | $15.00 |
| GPT‑4o | $2.50 | $10.00 |
对于涉及大量输入和结构化输出的智能体工作负载,DeepSeek V4 Pro 成为新的性价比最佳选择。
进一步阅读
- 更新的 V4 智能体自动化指南。