오늘 나는 흩어진 features를 하나의 경험으로 만들려고 시도했다
발행: (2026년 2월 25일 오후 01:56 GMT+9)
2 분 소요
원문: Dev.to
Source: Dev.to
개요
이 포스트는 Gemini Live Agent Challenge에 참여하기 위해 작성했습니다.
오늘은 모든 개별 파트가 드디어 서로 대화하기 시작한 날처럼 느껴졌습니다.
구현 세부 사항
기반
- Backend: Go scaffold
- Frontend: Next.js PWA renderer
실시간 음성 흐름
- WebSocket 프록시
- Live API 도구 루프
온보딩 파이프라인
- OAuth 인증
- 비디오 분석
- 음성 매칭
- 전환 로직
리유니언 레이어 향상
- 감정 대화 규칙
- 메모리 회상
- 배경 음악 (BGM) 제어
- 이미지 일관성
경험 후
- 앨범 생성
- 공유 페이지
신뢰성 및 배포
- 단위 및 엔드‑투‑엔드 테스트 커버리지
- Cloud Run 설정
- 업데이트된 README
결과
- 온보딩 → 리유니언 → 앨범이 끊김 없이 한 번에 진행된 첫 전체 실행.
- 작업을 작고 이슈‑단위 PR로 나누어 정신적 안정을 유지.
- 화면이 대시보드 느낌에서 장면 느낌으로 전환됨.
회고
- 실시간 동작은 여전히 자신감을 주기 어려운 영역.
- CI와 린팅이 너무 급하게 진행하고 싶을 때 나를 바로 잡아줌.
- 감정 연속성(음성, 시각, 분위기)을 함께 유지해야 함.
- 로봇식 체인지로그가 아니라 인간 일기처럼 이 로그를 계속 써 나갈 예정.