DeepSeek V4 Pro 방금 출시 — AI 에이전트를 위해 바뀐 점
발행: (2026년 4월 25일 PM 12:10 GMT+9)
2 분 소요
원문: Dev.to
Source: Dev.to
개요
DeepSeek V4 Pro는 2026년 4월 24일에 출시되었으며, 프로덕션 에이전트에서 운영 중입니다. 듀얼‑모드 아키텍처(Think / Non‑Think)를 도입하고 최대 1 백만 토큰의 컨텍스트를 지원해 대규모 장기 컨텍스트 작업을 가능하게 합니다.
사양
| 특징 | 세부 정보 |
|---|---|
| 전체 파라미터 | 1.6 T (Mixture‑of‑Experts) |
| 활성 파라미터 | 49 B |
| 컨텍스트 윈도우 | 1 M 토큰 (검증됨) |
| 모드 | Think / Non‑Think 듀얼 |
| 라이선스 | MIT |
| 가격 | $1.74 / 1M 입력, $3.48 / 1M 출력 |
사용 예시
# Python example using the NVIDIA NIM endpoint
client = OpenAI(
base_url="https://integrate.api.nvidia.com/v1",
api_key=""
)
response = client.chat.completions.create(
model="deepseek-ai/deepseek-v4-pro",
messages=[...]
)
성능 하이라이트
- 장기 컨텍스트 작업: 전체 대화 로그를 효율적으로 처리합니다.
- Thinking 모드: 요청당 8–15 초 소요, V3에 비해 다단계 계획 능력이 크게 향상되었습니다.
- Non‑thinking 모드: 요청당 약 2 초, 고처리량 콘텐츠 파이프라인에 충분히 빠릅니다.
- 함수 호출: V3.2보다 더 안정적입니다.
가격 비교
| 모델 | 입력 ($/1M) | 출력 ($/1M) |
|---|---|---|
| DeepSeek V4 Pro | $1.74 | $3.48 |
| Claude Sonnet 4.6 | $3.00 | $15.00 |
| GPT‑4o | $2.50 | $10.00 |
대량 입력과 구조화된 출력을 필요로 하는 에이전트 워크로드에 있어 DeepSeek V4 Pro가 새로운 최적점으로 부상합니다.
추가 읽을거리
- V4용 업데이트된 에이전트 자동화 가이드.