왜 내 AI 충돌 재구성 MVP는 아직 프로덕션에 준비되지 않았는지 (그리고 내가 다시 구축하는 이유)
Source: Dev.to
데모 단계 및 초기 프로토타입
React, Vite, 그리고 Gemini 3 Pro SDK를 사용해 프론트엔드‑우선 개념 증명으로 Incident Lens AI라는 사고 재구성용 포렌식 비디오 분석 스위트를 만들었습니다. 브라우저가 비디오 프레임과 오디오를 직접 LLM에 스트리밍하고, LLM이 사고를 추론·책임 타임라인을 생성·교통법규를 인용·대시보드용 구조화된 JSON을 출력합니다. 이 접근법 덕분에 UI를 빠르게 반복하고 백엔드 인프라 없이 멀티모달 개념을 검증할 수 있었습니다.
원래 아키텍처가 확장되지 못하는 이유
보안 문제
클라이언트에서 원시 대시캠·CCTV 영상을 공개 LLM API로 보내는 것은 민감한 데이터와 개인 식별 정보를 다루는 기업에게는 절대 불가능합니다. 보험 파일럿 프로그램이 이러한 데이터 노출 위험을 승인하지 않을 것입니다.
환각 및 정확도 문제
LLM은 물리 엔진이 아닙니다. 초기 문서에서는 AI가 사진측량과 운동역학을 통해 차량 속도를 계산할 수 있다고 주장했지만, 카메라 보정이 정확하지 않으면 모델은 단순히 추측에 불과합니다. 법정에서 “AI‑추정” 속도는 쉽게 이의 제기·기각될 수 있습니다.
하이브리드 아키텍처로 전환
결정론적 백엔드 처리
무거운 연산을 보안된 Python 백엔드로 옮겨, 결정론적인 컴퓨터 비전 도구(예: OpenCV)를 사용해 픽셀 속도, 정확한 충돌 좌표 등 측정 가능한 데이터를 추출합니다. 이 숫자들을 기존 물리 공식에 입력해 실제 속도와 힘을 계산합니다.
Gemini LLM의 역할
결정론적인 데이터가 준비되면 Gemini가 파이프라인에 다시 투입되어 가장 잘하는 일을 수행합니다: 판례를 교차 검토하고, 타임라인을 합성하며, 인간이 읽을 수 있는 보고서를 생성합니다. 이 분리를 통해 최종 보고서는 수학적으로 정확하면서도 법적으로 설득력을 갖게 됩니다.
향후 단계 및 협업 요청
현재 저장소는 멀티모달 AI가 포렌식에 어떻게 활용될 수 있는지를 보여주는 개념 증명으로 남겨두었습니다. 시스템을 보안·결정론적·법적으로 방어 가능하게 만드는 실제 엔지니어링 작업은 이제부터 시작됩니다. AI 프로토타입을 제로‑트러스트 산업의 프로덕션으로 전환하는 과정을 겪고 있다면, 여러분의 접근 방식을 듣고 싶습니다.
프론트엔드 프로토타입
프론트엔드 프로토타입을 여기서 확인할 수 있습니다:
Incident Lens AI의 프로덕션 비전
Incident Lens AI는 보험사, 법률 방어팀, 차량 안전 관리자를 위한 프로덕션‑급 플랫폼이 되는 것을 목표로 합니다. Google Gemini 3 Pro의 멀티모달 기능을 활용해 비구조화된 비디오 증거(대시캠, CCTV, 바디캠)를 법적으로 인정받을 수 있는 포렌식 재구성으로 전환합니다.
주요 기능
-
자율 재구성
- 물리 엔진: 사진측량 및 모션 블러 분석을 통해 차량 속도((v = d/t))를 계산합니다.
- 신호 추론: 교차 교통 흐름과 보행자 행동을 분석해 가려진 신호등 상태를 판단합니다.
- 잔해 필드 분석: 유리 파편 궤적 및 액체 스프레이 패턴으로 충격 벡터를 재구성합니다.
-
법적 인정 가능성
- 검색 근거: Gemini를 사용해 특정 법령 및 판례를 인용함으로써 모든 주장에 검증 가능한 법적 근거를 제공합니다.
기여에 관심이 있거나 더 알고 싶다면, 언제든지 연락하거나 GitHub 저장소에 풀 리퀘스트를 제출해 주세요.