오늘 나는 흩어진 features를 하나의 경험으로 만들려고 시도했다

발행: 3일 전 (2026년 2월 25일 오후 01:56 GMT+9)

2 분 소요

원문: Dev.to

Source: Dev.to

개요

이 포스트는 Gemini Live Agent Challenge에 참여하기 위해 작성했습니다.
오늘은 모든 개별 파트가 드디어 서로 대화하기 시작한 날처럼 느껴졌습니다.

구현 세부 사항

기반

Backend: Go scaffold
Frontend: Next.js PWA renderer

실시간 음성 흐름

WebSocket 프록시
Live API 도구 루프

온보딩 파이프라인

OAuth 인증
비디오 분석
음성 매칭
전환 로직

리유니언 레이어 향상

감정 대화 규칙
메모리 회상
배경 음악 (BGM) 제어
이미지 일관성

경험 후

앨범 생성
공유 페이지

신뢰성 및 배포

단위 및 엔드‑투‑엔드 테스트 커버리지
Cloud Run 설정
업데이트된 README

결과

온보딩 → 리유니언 → 앨범이 끊김 없이 한 번에 진행된 첫 전체 실행.
작업을 작고 이슈‑단위 PR로 나누어 정신적 안정을 유지.
화면이 대시보드 느낌에서 장면 느낌으로 전환됨.

회고

실시간 동작은 여전히 자신감을 주기 어려운 영역.
CI와 린팅이 너무 급하게 진행하고 싶을 때 나를 바로 잡아줌.
감정 연속성(음성, 시각, 분위기)을 함께 유지해야 함.
로봇식 체인지로그가 아니라 인간 일기처럼 이 로그를 계속 써 나갈 예정.

관련 글

멀티 서비스 배포에서 Authentication Token 불일치 해결 방법

TL;DR Railway, VPS, 로컬 Mac Mini 간의 인증 토큰 불일치로 인해 일부 API가 실패했습니다. INTERNAL_AUTH_SEC를 동기화하여 문제를 해결했습니다.

OpenWebUI와 llama.cpp로 직접 로컬 AI 채팅 실행 - Windows

TL;DR 로컬 ChatGPT와 유사한 스택으로, UI는 OpenWebUI를 사용하고 추론 서버는 llama.cpp를 사용하며, Hugging Face의 GGUF 모델을 사용합니다. 모든 것이 ...

AI 기반 클래스 제안으로 상표 생성 혁신

개요: 맞춤형 대형 언어 모델(LLM)을 수백만 건의 USPTO 상표 기록이 포함된 방대한 데이터베이스에 파인튜닝함으로써, 우리는 우리가 믿는 바에 따라 개발했습니다 i...

핸드 코딩 URDF를 그만두세요: Blender와 ROS 2를 원활하게 연결한 방법

문제 당신은 CAD에서 아름답고 기계적으로 완벽한 로봇을 설계하는 데 몇 주를 보냅니다. 그런 다음 Gazebo에서 시뮬레이션하거나 ROS 2로 제어해야 합니다. 갑자기,…