오늘 나는 흩어진 features를 하나의 경험으로 만들려고 시도했다

발행: (2026년 2월 25일 오후 01:56 GMT+9)
2 분 소요
원문: Dev.to

Source: Dev.to

개요

이 포스트는 Gemini Live Agent Challenge에 참여하기 위해 작성했습니다.
오늘은 모든 개별 파트가 드디어 서로 대화하기 시작한 날처럼 느껴졌습니다.

구현 세부 사항

기반

  • Backend: Go scaffold
  • Frontend: Next.js PWA renderer

실시간 음성 흐름

  • WebSocket 프록시
  • Live API 도구 루프

온보딩 파이프라인

  • OAuth 인증
  • 비디오 분석
  • 음성 매칭
  • 전환 로직

리유니언 레이어 향상

  • 감정 대화 규칙
  • 메모리 회상
  • 배경 음악 (BGM) 제어
  • 이미지 일관성

경험 후

  • 앨범 생성
  • 공유 페이지

신뢰성 및 배포

  • 단위 및 엔드‑투‑엔드 테스트 커버리지
  • Cloud Run 설정
  • 업데이트된 README

결과

  • 온보딩 → 리유니언 → 앨범이 끊김 없이 한 번에 진행된 첫 전체 실행.
  • 작업을 작고 이슈‑단위 PR로 나누어 정신적 안정을 유지.
  • 화면이 대시보드 느낌에서 장면 느낌으로 전환됨.

회고

  • 실시간 동작은 여전히 자신감을 주기 어려운 영역.
  • CI와 린팅이 너무 급하게 진행하고 싶을 때 나를 바로 잡아줌.
  • 감정 연속성(음성, 시각, 분위기)을 함께 유지해야 함.
  • 로봇식 체인지로그가 아니라 인간 일기처럼 이 로그를 계속 써 나갈 예정.
0 조회
Back to Blog

관련 글

더 보기 »

AI 기반 클래스 제안으로 상표 생성 혁신

개요: 맞춤형 대형 언어 모델(LLM)을 수백만 건의 USPTO 상표 기록이 포함된 방대한 데이터베이스에 파인튜닝함으로써, 우리는 우리가 믿는 바에 따라 개발했습니다 i...