표준 AI 대화 이식성은 아직 존재하지 않는다: 이것이 당신에게 왜 중요한가
Source: Dev.to
AI 데이터 내보내기의 현재 상황
ChatGPT는 데이터를 conversations.json 파일로 내보냅니다. 이는 모든 대화를 메시지 노드 트리 형태로 포함하는 중첩 JSON 구조입니다. 각 노드에는 ID, 부모 ID, 작성자 역할 메타데이터, 콘텐츠 파트 배열, 상태 플래그, 가중치 값, 타임스탬프 및 다양한 내부 속성이 포함됩니다.
2년 분량의 대화 기록은 500 MB가 넘는 파일을 생성할 수 있습니다. 중첩 깊이 때문에 파싱 비용이 많이 듭니다. 메타데이터 대비 콘텐츠 비율이 크게 오버헤드 쪽으로 치우쳐 있으며, 구조는 완전히 ChatGPT 전용입니다. 다른 AI 플랫폼에서는 이 형식을 이해하지 못합니다. 이는 AI 대화 내보내기가 어떻게 생겨야 하는지 정의하는 표준이 없기 때문입니다.
Claude의 내보내기도 JSON이지만 구조와 메타데이터가 다르며, 근본적인 문제는 동일합니다: 상호 운용성이 없는 플랫폼 전용 형식이라는 점입니다.
AI 대화를 위한 IMAP과 같은 것이 없습니다—공통 스키마, 교환 형식, 혹은 RFC가 존재하지 않습니다.
관심을 가져야 할 엔지니어링 문제
우리는 다른 모든 소프트웨어 카테고리에서 데이터 이동성을 기본 요구 사항으로 받아들입니다:
- 데이터베이스는 SQL 덤프와 표준 가져오기 형식을 가지고 있습니다.
- 이메일은 IMAP과 MBOX를 지원합니다.
- 클라우드 스토리지는 표준화된 파일 시스템을 갖추고 있습니다.
- 소셜 미디어 플랫폼은 규제 압력으로 인해 이제 제3자 도구가 처리할 수 있는 형식으로 데이터를 내보냅니다.
AI 어시스턴트는 아직 이 기대를 충족시키지 못하고 있습니다. 이는 산업이 아직 젊고 관련 데이터가 분류하기 더 어렵기 때문입니다. 대화 기록은 테이블도, 파일도, 단순한 메시지 스레드도 아니며, 시간이 지남에 따라 시스템의 응답 방식을 형성하는 진화하는 컨텍스트입니다. 원시 텍스트만 옮기는 것으로는 충분하지 않습니다—구조, 주제 간 관계, 그리고 새로운 시스템이 실제로 활용할 수 있는 충분한 조직적 컨텍스트까지 모두 옮겨야 합니다.
작동 구현
Phoenix Grove Systems는 ChatGPT 또는 Claude의 원시 내보내기 파일을 구조화된 “메모리 칩” 파일로 변환하는 Memory Forge라는 도구를 출시했습니다.
- 아키텍처: 모든 처리는 브라우저 내 클라이언트‑사이드에서 이루어집니다. 서버 호출도 없고 데이터 전송도 없습니다. 사용자는 프로세스 중 개발자 도구의 Network 탭을 확인함으로써 이를 검증할 수 있습니다.
- 출력: 플랫폼‑특화 메타데이터가 제거된 단일 파일이며, 대화 주제별로 인덱싱되고, 어떤 AI든 인입 시 파싱할 수 있는 시스템 지시문 형식으로 구성됩니다.
- 사용법: 메모리 칩을 파일 업로드를 지원하는 모든 AI 플랫폼(Claude, Gemini, Grok 등)에 로드하면, 새로운 시스템이 사용자의 전체 대화 컨텍스트—프로젝트, 선호도, 작업 패턴, 누적된 이해—에 접근할 수 있게 됩니다.
- 비용: 월 $3.95. 대용량 내보내기 파일도 몇 분 안에 처리되며, 몇 시간이 걸리지 않습니다.
제품이든 개념 증명이든 평가 방식은 동일합니다: AI 대화 이동성 문제는 현재 기술로 해결 가능하다는 점입니다. 플랫폼 자체가 이를 해결하지 못한 이유는 기술적인 것이 아니라 전략적인 것입니다. 락‑인(lock‑in)이 유지율을 높이고, 이동성은 이를 위협하기 때문입니다.
표준이 어떻게 보일 수 있는가
휴대 가능한 AI 대화 형식은 다음과 같은 요소가 필요할 것입니다:
- 플랫하거나 얕게 중첩된 구조로, 어떤 시스템이든 플랫폼 특화 지식 없이 파싱할 수 있어야 합니다.
- 명확한 구분이 사용자 메시지, AI 응답, 시스템/메타데이터 콘텐츠 사이에 있어야 합니다.
- 주제 또는 스레드 경계가 있어 전체를 한 번에 로드하는 것이 아니라 선택적으로 로드할 수 있어야 합니다.
- 컨텍스트 지시를 포함하는 헤더 블록(Memory Forge가 생성하는 것과 유사)으로, 수신 AI가 데이터를 어떻게 활용해야 하는지 알 수 있게 합니다.
이를 “AI용 .mbox”라고 생각하면 됩니다—멋지지는 않지만 실용적입니다.
Phoenix Grove Systems는 메모리 칩 포맷으로 이와 유사한 독점 버전을 효과적으로 구축했습니다. 업계가 표준으로 수렴할지, 아니면 Memory Forge와 같은 도구가 사실상의 다리 역할을 할지는 아직 미지수입니다. 플랫폼이 휴대성을 해결하기 위해 기다릴수록 서드파티 솔루션이 그 격차를 메우게 될 것입니다.
더 큰 패턴
- 독점 잠금 → 사용자 불만 → 제3자 브리지 → 궁극적인 표준화
이메일은 약 15년, 모바일 번호는 약 10년이 걸렸으며, 클라우드 데이터 이동성은 아직 진행 중입니다.
AI 대화 기록은 이 곡선의 아주 시작 단계에 있습니다. 플랫폼은 이동할 인센티브가 거의 없으며, 사용자들은 이제 막 잠금이 존재한다는 것을 깨닫기 시작했습니다. 이를 깨뜨리는 첫 번째 도구들이 이제 출시되고 있습니다.
AI 분야에서 일하거나 AI 도구를 만들거나, 대화 기록에 실질적인 가치를 두고 AI 어시스턴트를 많이 사용하는 경우, 이 주목할 만합니다. 이동성 문제는 곧 다가올 것이며, 산업이 주도할지 아니면 끌려갈지는 시간 문제입니다.
Memory Forge는 사용해 보고 싶다면 이용할 수 있습니다.