알리바바, AI 풀스택 업그레이드 발표…신규 LLM·AI칩·인프라 공개
발행: (2026년 5월 21일 PM 01:57 GMT+9)
3 분 소요
원문: Platum
Source: Platum

AI 풀스택 업그레이드 발표
알리바바 그룹은 20일 알리바바 클라우드 서밋(Alibaba Cloud Summit)에서 클라우드 인프라·모델 서비스·AI 칩·파운데이션 모델을 아우르는 AI 풀스택 업그레이드를 발표했습니다.
Qwen3.7‑Max
- 알리바바가 새롭게 선보인 대규모 언어 모델(LLM)
- 에이전틱 코딩, 복잡한 추론, 장기 작업 수행에 최적화
- 최대 35시간 연속 작동 및 1,000회 이상의 툴 호출을 성능 저하 없이 처리
- 코드 생성·디버깅, 오피스 워크플로 자동화, 멀티스텝 작업 지원
- OpenClaw·Claude Code·Qoder 등 주요 에이전트 프레임워크와 호환되도록 최적화
- 향후 모델 스튜디오(Model Studio) 를 통해 전 세계 개발자에게 제공될 예정
모델 서비스 플랫폼 바이리엔 (Bailian)
- 에이전트 실행 피드백 기반 강화학습 메커니즘인 에이전틱 RL(Agentic RL) 도입
- 지속적인 모델 개선을 추진
- 사전에 정의된 범위 내에서 자율적으로 동작하는 에이전트를 지원하는 안전 거버넌스 기능을 기본 제공
인프라 업데이트
- 알리바바 반도체 설계 자회사 T‑Head가 최신 AI 가속기 Zhenwu M890을 공개
- 이전 모델 대비 3배 향상된 성능
- 144 GB GPU 메모리와 초당 800 GB 칩 간 대역폭 제공
- T‑Head 전용 소프트웨어 스택 **T‑Head SAIL™**을 공개해 칩의 컴퓨팅 잠재력을 극대화
- Panjiu AL128 슈퍼노드 서버 출시
- Zhenwu M890과 ICN Switch 1.0 탑재
- 단일 랙에 128개의 AI 가속기를 고밀도로 집적해 페타바이트‑퍼‑세컨드(PB/s) 급 대역폭 제공
- 현재까지 Zhenwu 칩은 56만 개 이상 출하됐으며, 자동차·금융 서비스를 포함한 20개 산업 분야의 400개 이상 고객사가 활용하고 있습니다.