트라비고

발행: 1개월 전 (2026년 3월 17일 오전 07:43 GMT+9)

4 분 소요

원문: Dev.to

Source: Dev.to

Overview

Travigo는 멀티모달 입력 및 출력을 활용하는 차세대 AI 에이전트로, 단순한 텍스트 입력/출력 상호작용을 훨씬 넘어섭니다. Google의 Gen AI SDK, Gemini Live API, Gemini 3, 그리고 Google Maps API 클라우드 서비스를 결합해 생성형 AI와 공간 컨텍스트를 융합함으로써 복잡한 문제를 해결하고 몰입형 3D 내비게이션 및 스토리텔링 경험을 만들어냅니다.

Features

Multimodal Interactions

음성 및 텍스트로 소통하면서 AI가 인터랙티브 스트리트 뷰와 3D 지도 공간 데이터에서 실시간 시각적 컨텍스트를 처리합니다.

Dynamic Personas

Concierge Mode: 현실감 있는 현지 가이드.
Game Mode: 신비로운/런타임 퍼소나.
추가적인 현지 퍼소나는 사용자의 AR 위치와 스트리트 뷰를 기반으로 Gemini 3가 즉석에서 생성합니다.

Real‑time Context Processing

Live Agent Orchestrator를 사용해 대화와 음성을 사용자 행동 및 공간 이벤트와 직접 연결된 스트림 형태로 처리합니다.

Immersive Storytelling

UI와 3D 환경에 매끄럽게 오버레이되는 컨텍스트 기반 내러티브를 생성합니다.

Architecture

프로젝트는 다중 모델 아키텍처를 사용하며, 작업에 따라 Google Gen AI SDK에서 다양한 Gemini 모델을 선택합니다:

Live Agent Orchestrator: 음성 및 오디오 스트리밍을 통한 실시간 멀티모달 대화를 담당합니다.
Scout Queries: Google Maps 도구를 활용해 위치 검색을 기반으로 합니다.
Strategic Analysis: 물류 계획, 투어 설계, 공간 컨텍스트 기반 가상의 퍼소나 생성, 비자 계획 또는 역사적 심층 탐구 등 고차원 추론 작업을 수행하며, 모두 Google Search에 의해 근거가 제공됩니다.

Gemini Models Used

Model	Purpose
`gemini-2.5-flash-native-audio-preview`	실시간 멀티모달 대화(음성 및 오디오 스트리밍)를 위한 Live Agent Orchestrator를 구동합니다.
`gemini-2.5-flash`	특히 Google Maps 도구를 이용한 위치 검색을 기반으로 하는 빠른 “Scout” 쿼리를 처리합니다.
`gemini-3.1-pro-preview`	물류 계획, 퍼소나 생성, 전략적 분석 등 고차원(고수준 사고) 복합 추론 작업을 수행합니다.

트라비고

Overview

Features

Multimodal Interactions

Dynamic Personas

Real‑time Context Processing

Immersive Storytelling

Architecture

Gemini Models Used

관련 글

왜 오픈소스 AI 도구가 조용히 승리하고 있는가

신뢰 부채: AI 생성 코드베이스에 숨겨진 프로덕션 위기

전체 Agentic 배포 파이프라인 실행: Scaffold에서 Live CloudFront까지

왜 Local-First가 생산성의 미래인가