Gemini Live Agent Challenge를 위한 RehearsAI 구축
Source: Dev.to
Overview
몇 주 전, 우리는 Gemini Live Agent Challenge라는 구글 해커톤을 접하게 되었습니다. 이 행사는 Gemini를 활용한 실시간 AI 에이전트 구축에 초점을 맞추고 있었으며, 우리는 즉시 관심을 가졌습니다. 우리는 텍스트 기반 AI 앱을 한동안 실험해 왔지만, 실시간 에이전트를 활용한 무언가를 만들고 싶어 했습니다.
Concept: Rehearse AI
Rehearse AI는 어려운 대화를 연습할 수 있도록 설계된 앱입니다. 사용자는 AI 에이전트와 대화를 시뮬레이션하고, 타임라인을 되감아 다른 응답을 시도하며, 자신이 말하는 내용에 따라 대화가 어떻게 전개될 수 있는지 탐색할 수 있습니다. 아이디어는 간단합니다: 실제 상황이 되기 전에 대화를 연습함으로써, 순간이 찾아왔을 때 준비된 상태가 되는 것입니다.
Prototyping
우리는 Google AI Studio에서 프로젝트 프로토타입을 시작했고, Gemini 모델, Google AI SDK, 그리고 React를 사용해 앱을 구축했습니다.
Technical Challenges
가장 큰 도전 과제 중 하나는 대화 타임라인을 설계하는 것이었습니다. 사용자가 타임라인을 되감아 다른 응답을 시도할 수 있기 때문에, UI와 AI의 대화 상태 모두에서 이러한 변화를 어떻게 반영할지 고민해야 했습니다. 이를 위해 다음 사항들을 반복적으로 다듬었습니다:
- 타임라인이 작동하는 방식
- 브랜치가 표현되는 방식
- AI가 현재 대화 맥락을 이해하는 방법
Impact
많은 사람들이 어려운 대화를 앞두고 불안을 느낍니다—예를 들어 급여 인상을 요청하거나 피드백을 제공하거나 경계를 설정하는 상황 등. Rehearse AI는 이러한 순간을 안전하게 연습할 수 있는 공간을 제공합니다.
Reflections
우리에게 이 프로젝트는 AI를 바라보는 새로운 관점을 제시했습니다. 단순히 텍스트를 생성하는 도구가 아니라, 실제 생활에서의 의사결정을 시뮬레이션할 수 있는 환경으로서의 AI였습니다.
이 콘텐츠는 Gemini Live Agent Challenge 해커톤에 참여하면서 만든 것입니다.
GeminiLiveAgentChallenge #GoogleAI #Gemini #GoogleCloud #AI #BuildInPublic