2025년 12월 12일 | Tongyi Weekly: Tongyi Lab에서 전하는 최첨단 AI 주간 요약

발행: 1개월 전 (2025년 12월 12일 오후 02:59 GMT+9)

6 min read

원문: Dev.to

Source: Dev.to

Qwen3‑Omni‑Flash (2025‑12‑01) – 더 똑똑하고, 더 인간적인

향상된 다중 턴 영상/오디오 이해 – 대화가 자연스럽게 흐릅니다.
시스템 프롬프트를 통해 AI의 성격을 맞춤 설정 (역할극 시나리오를 떠올려 보세요!).
더 똑똑한 언어 처리 + 견고한 지원: 119개 텍스트 언어 | 19개 음성.
인간과 구분이 어려운 음성.

지금 사용해 보기:
Qwen Chat – 오른쪽 하단의 VoiceChat 및 VideoChat 버튼을 클릭하세요.

Qwen3‑TTS (2025‑11‑27) – 실제 같은 목소리

다양한 성격: 귀엽고 장난스러운 것부터 현명하고 엄격한 것까지 49개 이상의 고품질 음성.
전 세계 지원: 10개 언어(zh, en, de, it, pt, es, ja, ko, fr, ru)와 실제 방언(민난, 우, 광동어, 사천, 베이징, 난징, 톈진, 산시)을 지원.
극히 자연스러움: 리듬과 속도가 실제 사람처럼 자동 조절됩니다.

지금 사용해 보기:
Qwen Chat – Response → Read aloud를 클릭하세요.

Qwen Code v0.2.2 → v0.3.0: 스트림 JSON + 글로벌 지원

스트림 JSON 지원

--output-format stream-json 로 스트리밍 출력.
--input-format stream-json 로 구조화된 입력.
3단계 어댑터 아키텍처 + 완전한 세션 관리.
SDK 통합, 자동화 도구, CI/CD 파이프라인을 위한 무한한 가능성.

완전한 국제화

내장 EN/CN 인터페이스 + 사용자 정의 언어 팩 확장.
/language ui zh-CN – 원클릭 UI 전환.
/language output Chinese – AI 출력 언어 설정.
전 세계 개발자들이 로컬 언어 팩을 기여하도록 환영합니다.

보안 및 안정성 대폭 향상

GitHub Repository

Qwen Learn Mode — 당신만을 위한 AI 학습 튜터

답만 주는 것이 아니라 소크라테스식 대화로 안내합니다.
현재 수준에 맞춰 최적의 학습 구역을 유지합니다.
복잡한 논리를 압도되지 않게 다룰 수 있도록 정신적 골격을 구축합니다.

✨ Learn Mode 사용해 보기

SAPO: RL 훈련을 위한 부드러운 경로

부드러운 트러스트 영역 동작 → 급격한 그래디언트 감소 없음.
시퀀스‑레벨 일관성 → 정렬된 시퀀스‑레벨 동작.
토큰‑레벨 적응성 → 유용한 그래디언트를 보존하고 샘플 효율성을 높임.
비대칭 온도 → 특히 MoE 모델에서 안정성이 크게 향상.

실제 의미:

더 긴 안정적인 RL 실행.
Pass@1 점수 상승.
Qwen3‑VL의 수학, 코딩 및 멀티모달 작업에서 강력한 성능 향상.

Paper on arXiv
Technical Blog

모델 이정표: Z‑Image‑Turbo

#1 오픈소스 모델 – 전체 상위 10위 중 유일한 오픈 모델.
고충실도 출력, $5/1k 가격, 완전 오픈소스.
접근성 높고 저렴하며 커뮤니티 주도형 생성 AI.

Qwen3‑4B: 파인‑튜닝을 위한 #1 베이스 모델

Read the full report

XiYan‑SQL: 모든 오픈 BIRD‑CRITIC 리더보드 #1

텍스트뿐 아니라 SQL도 다룸: 실패한 쿼리를 진단하고 수정합니다.
복잡한 작업(INSERT / UPDATE / DELETE)을 지저분하고 다중 방언 데이터베이스에서도 처리.
보지 못한, 분포 외 데이터베이스에서도 견고함 유지.

실제 의미:

실제 프로덕션 환경에서 더 신뢰할 수 있는 SQL 디버깅.
지저분하고 변화하는 데이터 스택에 대한 강력한 견고성.

커뮤니티 축하: WanMuse+ “Heartbeat” 수상자 발표

🎉 모든 최종 후보와 수상자에게 축하의 인사를 전합니다!

Learn More

라이트 마이그레이션 LoRA: Qwen‑Edit‑2509‑Light‑Migration

Try it here

업스케일 LoRA: Qwen‑Image‑Edit‑2509‑Upscale2K

Try it here

새로운 릴리스를 놓치지 마세요:

Subscribe to The Tongyi Weekly

Tongyi Lab 소개

Tongyi Lab은 알리바바 그룹 산하의 연구 기관으로, 인공지능 및 기초 모델에 전념하고 있습니다. 주요 연구 분야는 대형 언어 모델(LLM), 멀티모달 이해 및 생성, 시각 AIGC, 음성 기술 등입니다.