트라비고

발행: (2026년 3월 17일 오전 07:43 GMT+9)
4 분 소요
원문: Dev.to

Source: Dev.to

Overview

Travigo는 멀티모달 입력 및 출력을 활용하는 차세대 AI 에이전트로, 단순한 텍스트 입력/출력 상호작용을 훨씬 넘어섭니다. Google의 Gen AI SDK, Gemini Live API, Gemini 3, 그리고 Google Maps API 클라우드 서비스를 결합해 생성형 AI와 공간 컨텍스트를 융합함으로써 복잡한 문제를 해결하고 몰입형 3D 내비게이션 및 스토리텔링 경험을 만들어냅니다.

Features

Multimodal Interactions

  • 음성 및 텍스트로 소통하면서 AI가 인터랙티브 스트리트 뷰와 3D 지도 공간 데이터에서 실시간 시각적 컨텍스트를 처리합니다.

Dynamic Personas

  • Concierge Mode: 현실감 있는 현지 가이드.
  • Game Mode: 신비로운/런타임 퍼소나.
  • 추가적인 현지 퍼소나는 사용자의 AR 위치와 스트리트 뷰를 기반으로 Gemini 3가 즉석에서 생성합니다.

Real‑time Context Processing

  • Live Agent Orchestrator를 사용해 대화와 음성을 사용자 행동 및 공간 이벤트와 직접 연결된 스트림 형태로 처리합니다.

Immersive Storytelling

  • UI와 3D 환경에 매끄럽게 오버레이되는 컨텍스트 기반 내러티브를 생성합니다.

Architecture

프로젝트는 다중 모델 아키텍처를 사용하며, 작업에 따라 Google Gen AI SDK에서 다양한 Gemini 모델을 선택합니다:

  • Live Agent Orchestrator: 음성 및 오디오 스트리밍을 통한 실시간 멀티모달 대화를 담당합니다.
  • Scout Queries: Google Maps 도구를 활용해 위치 검색을 기반으로 합니다.
  • Strategic Analysis: 물류 계획, 투어 설계, 공간 컨텍스트 기반 가상의 퍼소나 생성, 비자 계획 또는 역사적 심층 탐구 등 고차원 추론 작업을 수행하며, 모두 Google Search에 의해 근거가 제공됩니다.

Gemini Models Used

ModelPurpose
gemini-2.5-flash-native-audio-preview실시간 멀티모달 대화(음성 및 오디오 스트리밍)를 위한 Live Agent Orchestrator를 구동합니다.
gemini-2.5-flash특히 Google Maps 도구를 이용한 위치 검색을 기반으로 하는 빠른 “Scout” 쿼리를 처리합니다.
gemini-3.1-pro-preview물류 계획, 퍼소나 생성, 전략적 분석 등 고차원(고수준 사고) 복합 추론 작업을 수행합니다.
0 조회
Back to Blog

관련 글

더 보기 »

왜 Local-First가 생산성의 미래인가

소개 작업 관리자를 열 때마다 선택을 하고 있습니다. 대부분의 사람들은 이를 깨닫지 못하지만, 클라우드‑퍼스트 생산성 도구를 선택한다는 것은 …