구글, 즉시 음성‑음성 번역 가능한 Gemini 3.5 실시간 번역 발표

발행: (2026년 6월 10일 AM 03:57 GMT+9)
3 분 소요

Source: Ars Technica

구글은 수년간 실시간 번역을 추구해 왔으며, 이를 “선구적인 머신러닝 실험” 중 하나라고 말합니다. 과거 구글 행사 무대에서 수많은 데모를 선보였지만, 구글 폰, 이어버드 혹은 특정 설정이 필요했습니다. 지난해 구글은 번역 앱에 실시간 번역 기능을 도입해 더 많은 사용자에게 제공했으며, 이제는 그 범위를 더욱 확대하고 있습니다. Gemini 3.5 Live Translate가 출시되면서, 이제 더 많은 장소에서 이전보다 낮은 지연 시간으로 즉각적인 번역을 사용할 수 있게 됩니다.

새로운 AI 모델은 I/O 행사에서 발표된 3.5 버전 계열의 일부입니다. 오늘 이전까지 구글은 Flash 버전만 공개했으며, 앞으로 몇 주 안에 Pro 모델이 출시될 것으로 예상됩니다. Gemini 3.5 Live Translate는 70개 이상의 언어를 자동으로 감지하고 번역하도록 조정된 음성‑대‑음성 모델입니다.

구글에 따르면 Gemini 3.5 Live Translate는 일반 대화 속도를 따라잡을 만큼 빠르며, 화자를 몇 초 뒤에서 따라가면서 억양, 속도, 음높이까지 일치시킵니다. 즉, 목소리가 일반적인 로봇보다 사용자의 목소리에 더 가깝게 들립니다. 모든 데모는 통제된 환경에서 녹음된 것이지만, 인상적인 결과를 보여줍니다. 직접 모델의 능력을 확인해 보는 데 오래 기다릴 필요도 없습니다.

  Speech translation in Google Meet with Gemini 3.5 Live Translate.

      

Gemini 3.5 Live Translate는 구글 생태계 여러 영역에 순차적으로 배포되고 있습니다. 개발자는 Gemini Live API 또는 AI Studio의 공개 프리뷰를 통해 바로 구축을 시작할 수 있습니다. 이 모델은 음성을 지속적으로 처리하고 모든 다국어 입력을 자동으로 처리해, 개발자가 별도로 설정을 조정할 필요가 없게 합니다. 또한 복잡한 환경에서 배경 소음을 필터링해 줍니다.

0 조회
Back to Blog

관련 글

더 보기 »