2025년 12월 12일 | Tongyi Weekly: Tongyi Lab에서 전하는 최첨단 AI 주간 요약

발행: (2025년 12월 12일 오후 02:59 GMT+9)
6 min read
원문: Dev.to

Source: Dev.to

Qwen3‑Omni‑Flash (2025‑12‑01) – 더 똑똑하고, 더 인간적인

  • 향상된 다중 턴 영상/오디오 이해 – 대화가 자연스럽게 흐릅니다.
  • 시스템 프롬프트를 통해 AI의 성격을 맞춤 설정 (역할극 시나리오를 떠올려 보세요!).
  • 더 똑똑한 언어 처리 + 견고한 지원: 119개 텍스트 언어 | 19개 음성.
  • 인간과 구분이 어려운 음성.

지금 사용해 보기:
Qwen Chat – 오른쪽 하단의 VoiceChatVideoChat 버튼을 클릭하세요.


Qwen3‑TTS (2025‑11‑27) – 실제 같은 목소리

  • 다양한 성격: 귀엽고 장난스러운 것부터 현명하고 엄격한 것까지 49개 이상의 고품질 음성.
  • 전 세계 지원: 10개 언어(zh, en, de, it, pt, es, ja, ko, fr, ru)와 실제 방언(민난, 우, 광동어, 사천, 베이징, 난징, 톈진, 산시)을 지원.
  • 극히 자연스러움: 리듬과 속도가 실제 사람처럼 자동 조절됩니다.

지금 사용해 보기:
Qwen Chat – Response → Read aloud를 클릭하세요.


Qwen Code v0.2.2 → v0.3.0: 스트림 JSON + 글로벌 지원

스트림 JSON 지원

  • --output-format stream-json 로 스트리밍 출력.
  • --input-format stream-json 로 구조화된 입력.
  • 3단계 어댑터 아키텍처 + 완전한 세션 관리.
  • SDK 통합, 자동화 도구, CI/CD 파이프라인을 위한 무한한 가능성.

완전한 국제화

  • 내장 EN/CN 인터페이스 + 사용자 정의 언어 팩 확장.
  • /language ui zh-CN – 원클릭 UI 전환.
  • /language output Chinese – AI 출력 언어 설정.
  • 전 세계 개발자들이 로컬 언어 팩을 기여하도록 환영합니다.

보안 및 안정성 대폭 향상

GitHub Repository


Qwen Learn Mode — 당신만을 위한 AI 학습 튜터

  • 답만 주는 것이 아니라 소크라테스식 대화로 안내합니다.
  • 현재 수준에 맞춰 최적의 학습 구역을 유지합니다.
  • 복잡한 논리를 압도되지 않게 다룰 수 있도록 정신적 골격을 구축합니다.

Learn Mode 사용해 보기


SAPO: RL 훈련을 위한 부드러운 경로

  • 부드러운 트러스트 영역 동작 → 급격한 그래디언트 감소 없음.
  • 시퀀스‑레벨 일관성 → 정렬된 시퀀스‑레벨 동작.
  • 토큰‑레벨 적응성 → 유용한 그래디언트를 보존하고 샘플 효율성을 높임.
  • 비대칭 온도 → 특히 MoE 모델에서 안정성이 크게 향상.

실제 의미:

  • 더 긴 안정적인 RL 실행.
  • Pass@1 점수 상승.
  • Qwen3‑VL의 수학, 코딩 및 멀티모달 작업에서 강력한 성능 향상.

Paper on arXiv
Technical Blog


모델 이정표: Z‑Image‑Turbo

  • #1 오픈소스 모델 – 전체 상위 10위 중 유일한 오픈 모델.
  • 고충실도 출력, $5/1k 가격, 완전 오픈소스.
  • 접근성 높고 저렴하며 커뮤니티 주도형 생성 AI.

Qwen3‑4B: 파인‑튜닝을 위한 #1 베이스 모델

Read the full report


XiYan‑SQL: 모든 오픈 BIRD‑CRITIC 리더보드 #1

  • 텍스트뿐 아니라 SQL도 다룸: 실패한 쿼리를 진단하고 수정합니다.
  • 복잡한 작업(INSERT / UPDATE / DELETE)을 지저분하고 다중 방언 데이터베이스에서도 처리.
  • 보지 못한, 분포 외 데이터베이스에서도 견고함 유지.

실제 의미:

  • 실제 프로덕션 환경에서 더 신뢰할 수 있는 SQL 디버깅.
  • 지저분하고 변화하는 데이터 스택에 대한 강력한 견고성.

커뮤니티 축하: WanMuse+ “Heartbeat” 수상자 발표

🎉 모든 최종 후보와 수상자에게 축하의 인사를 전합니다!

Learn More


라이트 마이그레이션 LoRA: Qwen‑Edit‑2509‑Light‑Migration

Try it here


업스케일 LoRA: Qwen‑Image‑Edit‑2509‑Upscale2K

Try it here


구독

새로운 릴리스를 놓치지 마세요:

Subscribe to The Tongyi Weekly


Tongyi Lab 소개

Tongyi Lab은 알리바바 그룹 산하의 연구 기관으로, 인공지능 및 기초 모델에 전념하고 있습니다. 주요 연구 분야는 대형 언어 모델(LLM), 멀티모달 이해 및 생성, 시각 AIGC, 음성 기술 등입니다.

Back to Blog

관련 글

더 보기 »

Gemini 3용 새로운 Gemini API 업데이트

2025년 11월 25일 Gemini 3용 Gemini API의 새로운 기능 – 사고 제어를 위한 간소화된 매개변수 – 새로운 thinking_level 매개변수를 사용하면 사고의 깊이를 설정할 수 있습니다…