챗봇을 넘어: 신뢰할 수 있는 AI를 위한 청사진
Source: Google Developers Blog
Ajeet Mirwani
아메리카스 프로그램 리드, 구글 개발자 전문가
“시속 100 mph에서는 AI ‘환각’이 설 자리가 없습니다.”
레이스카가 캘리포니아 윌로스에 있는 썬더힐 레이스웨이에서 고속 코너에 접근할 때, 완벽한 라인과 위험한 스키드 사이의 차이는 밀리초 단위로 측정됩니다. 전통적으로 성능 텔레메트리는 사후에 무슨 일이 일어났는지 알려주는 정적 코드를 사용했습니다. 구글 개발자 전문가(GDE) 소규모 팀은 AI가 실시간으로 운전자의 귀에 들어가 원시 데이터를 신뢰할 수 있는 순간적인 안내로 변환할 수 있는지 확인하고 싶었습니다.

통합 여정을 통한 에이전트 주도 개발
이 테스트에서 가장 눈에 띄는 부분은 결과 자체가 아니라 개발 속도였습니다. Antigravity (AGY)—상태를 유지하는 에이전트 시스템을 조율하기 위한 구글의 새로운 프레임워크—를 활용해 팀은 자연어 기반 오케스트레이션으로 3개월짜리 개발 주기를 단 2주로 압축했습니다.
- AGY Agent Manager는 대규모 콜드‑패스 데이터 처리와 기본 물리 로직을 담당함으로써 워크플로를 가속화했고, GDE가 “바이브 코딩”을 통해 고수준 시스템 동작에 집중할 수 있게 했습니다.
- 이 프로젝트는 구글의 Unified Developer Journey에 대한 스트레스 테스트 역할을 했습니다. GDE는 Google AI Studio에서 빠른 프로토타이핑을 시작한 뒤, 그 청사진을 활용해 Vertex AI—프로덕션 급 시스템을 위한 “프로‑티어” 경로—로 전환했습니다.
- 수천 줄의 기본 물리 코드를 작성하는 대신, GDE는 원하는 에이전트 행동을 자연어로 기술했으며, 이를 통해 Firebase를 이용한 대규모 처리와 실시간 상태 관리용 아키텍처를 고정했습니다.

“스플릿‑브레인” 아키텍처
프레임워크의 기반은 “스플릿‑브레인” 아키텍처로, 반사 행동을 전략과 분리합니다. 이 복잡한 배포를 관리하기 위해 GDE는 특수 스트라이크 팀으로 운영되었습니다:
| 팀 | 멤버 | 역할 |
|---|---|---|
| 인텔리전스 팀 | Jigyasa Grover – LinkedIn Vikram Tiwari – LinkedIn | 다중 계층 시스템을 구현했습니다. Gemini Nano는 엣지에서 반사 행동을 수행하고; Gemini 3.0은 고수준 추론 및 전략적 랩 분석을 담당합니다. |
| Margaret Maynard‑Reid – LinkedIn | 일일 스탠드업을 주도했습니다. | |
| 엣지 팀 | Sebastian Gomez – LinkedIn | Web API를 통해 Gemini Nano를 Chrome에 통합하여 약 15 ms 응답 시간을 달성했습니다. |
| Austin Bennett | “Data Crucible” 노드를 고속으로 유지하도록 하드웨어 구성을 관리했습니다. | |
| 퍼셉션 팀 | Hemanth HM – LinkedIn Vikram Tiwari (위 참조) | 애플리케이션 계층에서 트랙을 구현했습니다. Maps MCP를 사용해 시스템이 트랙 레이아웃을 “볼” 수 있게 하고, 실시간 3D 텔레메트리를 60 FPS로 렌더링하여 운전자의 라인과 AI 권고를 비교하는 “고스트 분석”을 가능하게 했습니다. |

Antigravity는 Gemini Nano의 엣지 반사(~15 ms)와 Gemini 3.0의 전략적 추론 사이의 오케스트레이션 레이어 역할을 했습니다. 이러한 모델 간 핸드오프를 자동화함으로써 프레임워크는 시속 100 mph를 초과하는 속도에서도 실시간 상태 관리를 유지했습니다.
수학적으로 검증 가능한 코칭
신뢰는 검증에 기반합니다. Rabimba Karanjai – LinkedIn 는 AI의 조언이 물리학에 근거하도록 신경‑기호 학습(Neuro‑Symbolic Training) 방법을 구현했습니다.
- 모델은 QLoRA 를 사용해 “Golden Lap” 기준선으로 미세 조정되었으며, 이를 통해 시스템이 자체 코칭을 수학적으로 검증할 수 있습니다.
- AI가 “브레이크를 늦게 밟아라”고 제안할 때, 그 조언은 물리 기반 검증 단계에 의해 뒷받침됩니다.
팀은 실시간 트리아지를 위해 Draft → Verify → Refine 에이전시 루프를 사용했습니다:
- Draft – AGY Agent Manager 가 데이터 마찰이 발생할 경우(예: 피트 레인) 코드 수정을 제안합니다.
- Verify – 자동화된 브라우저 테스트가 새로운 로직을 텔레메트리 기준선에 대해 실행합니다.
- Refine – 검증된 업데이트가 랩 사이에 차량의 “Data Crucible” 로 푸시됩니다.
이 자체 교정 워크플로우는 “브레이크를 20 ft 늦게 밟아라”와 같은 코칭 조언이 언제나 물리적으로 근거가 있으며 안전을 위해 사전 검증됨을 보장합니다.
“Gemini Squad”: 교육학에 기반을 둔 접근
데이터와 인간 이해 사이의 격차를 메우기 위해 Lynn Langit – LinkedIn 은 Human Pedagogy에 기반한 persona‑based routing을 도입했습니다. 이 프레임워크는 AJ the Crew Chief와 Ross the Telemetry Engineer와 같은 에이전트들로 구성된 “Gemini Squad”를 활용하여 상황에 맞는 안내를 제공합니다. 교육학적 페르소나를 주입함으로써 시스템은 운전자의 전문성 수준에 맞춰 설명을 맞춤화하고, AI 권고가 실행 가능하고 이해하기 쉬운 것이 되도록 합니다.
근거 사실: 다음 현장 테스트
Thunderhill 현장 테스트는 AI Trust Gap을 분할‑뇌 아키텍처와 Google의 Unified Developer Journey를 사용해 해소할 수 있음을 입증했습니다. 시스템 출력물을 검토한 후, Thunderhill CEO인 Matt Busby는 다음과 같이 언급했습니다:
“여러분은 하루 만에 전체 산업이 40년 동안 이룬 것보다 더 많은 일을 해냈습니다. 이 시스템은 직감과 객관적 논리를 결합해 레이싱 데이터를 반복 가능하고 정확하게 만들며, 오늘 시장에 존재하는 것보다 수광년 앞선 수준입니다.”
구축할 준비가 되셨나요?
이 GDE 그룹이 시연한 바와 같이, 실험 프로토타입에서 프로덕션 시스템으로의 도약은 복잡하지만 충분히 헤쳐 나갈 수 있습니다. 만약 vibe 코딩을 넘어 Vertex AI의 pro‑tier에서 구축을 시작할 준비가 되었다면, 우리의 ADK Crash Course 를 시작하여 복잡한 작업을 수행하기 위해 추론하고, 계획하며, 도구를 활용할 수 있는 정교하고 자율적인 시스템을 구축해 보세요.
우리 GDE들의 심층 탐구
- Trust at Top Speed – Jigyasa Grover: 분할‑뇌 아키텍처 조정.
- A Split‑Brain Neuro‑Symbolic Training Method – Rabimba Karanjai: 안전성 및 검증 가능성을 위한 파인‑튜닝.
- Racing at the Edge – Lynn Langit: 인지 부하 관리와 페르소나 라우팅.
- Taking AI Agents to the Track – Hemanth HM: 브라우저‑기반 모델 및 지도 통합.
- The Race for Real‑Time – Vikram Tiwari.