Metatron: 살아있는 AI 기반 화학 실험실 구축 with Gemini

발행: (2026년 2월 9일 오후 11:29 GMT+9)
9 분 소요
원문: Dev.to

Source: Dev.to

Cover image for Metatron: Building a Living, AI-Powered Chemistry Lab with Gemini

화학은 종종 정적인 다이어그램과 추상적인 방정식을 통해 가르쳐진다. 어느 정도는 효과가 있지만, 분자가 반응하고, 상태가 변하거나 에너지를 방출할 때, 그런 평면적인 표현은 한계가 있다.

나는 이를 바꾸기 위해 Metatron을 만들고 싶었다.

Metatron은 “living” 화학 인텔리전스 플랫폼으로, SMILES 문자열과 같은 이론적 표현과 실질적이고 시각적인 실험실 경험 사이의 격차를 메워준다. 이 아이디어는 *“데이터의 대천사”*라는 개념에서 영감을 받았으며, 복잡한 연구를 감독하고 자연스러운 에이전시 인터페이스를 통해 고급 화학을 접근 가능하게 하는 AI 존재를 의미한다.

Metatron이 하는 일

Metatron은 학습과 실험 모두를 위해 설계된 AI 기반 화학 실험실 및 연구 보조 도구입니다.

🧪 가상 실험실

사용자는 화학 물질을 혼합하고 즉시 관찰할 수 있습니다:

  • 균형 잡힌 화학 방정식
  • 색 변화
  • 상 변화
  • 침전 또는 폭발과 같은 반응

모두 실시간으로 시각적으로 표시됩니다.

🤖 에이전트형 연구

화학 연구 에이전트는 분자를 받아 자율적으로:

  1. 연구 워크플로우를 계획합니다
  2. 단계들을 실행합니다
  3. 결과를 검증합니다
  4. 환경 영향을 평가합니다
  5. 구조화된 보고서를 생성합니다

단순히 질문에 답하는 것이 아니라 전체 연구 파이프라인을 수행합니다.

🎙️ 음성 지원

Metatron은 핸즈프리 인터랙션을 지원합니다. 사용자는 자연스럽게 말할 수 있으며, 시스템은 AI 기반 의도 파싱을 통해 음성 명령을 정확한 애플리케이션 동작으로 변환합니다.

🎓 인터랙티브 학습

플랫폼에는 또한 다음이 포함됩니다:

  • “도구 맞추기” 게임
  • 인터랙티브 주기율표
  • 분자별 설명과 통찰을 제공하는 AI 튜터

어떻게 만들었는가

Metatron은 TypeScript 스택을 기반으로 Vite + React를 사용해 구축했으며, Gemini 3 Flash가 핵심 추론 엔진 역할을 합니다.

핵심 로직 및 시각화

  • Zod를 사용한 스키마 검증을 Gemini의 구조화된 출력 모드에 맞는 JSON Schemas로 변환
  • PubChem에서 가져온 분자 데이터
  • 2D 분자 렌더링을 위한 RDKit
  • 인터랙티브 3D 분자 시각화를 위한 NGL
  • 가상 실험실 환경 및 반응 효과 구현을 위한 Three.js

에이전트 아키텍처

자율 연구 에이전트는 Gemini의 함수 호출을 활용해 다단계 워크플로우를 관리합니다:

Planning → Execution → Verification → Emissions Assessment → Reporting

이를 통해 AI가 단계별로 추론하고 상태를 유지하며 구조화된 과학적 결과물을 생성할 수 있습니다.

음성 NLP

VoiceCommandManager는 Gemini를 이용해 음성 명령을 해석하고 이를 애플리케이션 함수에 직접 매핑함으로써 원활한 음성 기반 인터랙션을 가능하게 합니다.

Gemini가 가능하게 한 것

Gemini는 단순히 텍스트 생성에만 사용되는 것이 아니라 앱의 핵심 오케스트레이션 레이어입니다.

주요 기능은 다음과 같습니다:

  • SMILES 표기법을 이용한 실시간 화학 분석
  • 가상 실험실에서의 반응 결과 예측
  • 동적인 교육 콘텐츠 생성
  • 음성 제어 탐색 및 연구
  • 신뢰할 수 있는 시뮬레이션을 위한 구조화된 JSON 출력

사용된 Gemini 기능

  • 구조화된 JSON 출력
  • 함수 호출
  • 시스템 지시문
  • 사고 모드 (includeThoughts)

도중에 마주한 도전들

Metatron을 만드는 일은 쉬운 일이 아니었습니다.

  • 석사 과정 학생으로서 시험과 여러 학술 프로젝트를 병행해야 했고, 개발에 할당할 시간이 제한되어 전적으로 혼자 작업해야 했습니다.
  • 3D 렌더링에 대한 급격한 학습 곡선: 처음으로 NGLThree.js를 사용했습니다. 원래는 전체 VR 실험실 경험을 구현하려 했지만, 시간 제약으로 첫 번째 버전은 웹 기반 시뮬레이션으로 제한되었습니다.
  • 음성 제어는 또 다른 도전 과제를 안겨주었습니다. SpeechRecognition Web API가 브라우저마다 일관되지 않게 동작해 테스트와 디버깅이 어려웠습니다.

이러한 난관에도 불구하고, 저는 기능적이고 시각적으로 풍부하며 AI 기반 화학 플랫폼을 성공적으로 제공했으며, 이는 향후 확장을 위한 견고한 기반이 됩니다.

내가 자랑스러운 것

  • 완전 자율적인 화학 연구 에이전트
  • Gemini + Zod를 사용한 신뢰할 수 있는 구조화된 AI 출력
  • 실시간 반응 시뮬레이션 및 시각화
  • 원활한 2D 및 3D 분자 렌더링
  • Gemini 함수 호출을 활용한 자연스러운 음성 제어

내가 배운 것

  • Zod와 JSON 스키마를 사용하여 AI 출력에 구조를 강제
  • Gemini를 이용한 다단계 자율 에이전트 구축
  • 함수 호출을 활용한 음성 제어 인터페이스 설계
  • Three.js와 NGL 같은 3D 렌더링 도구 사용
  • 개인 개발과 학업 책임의 균형 맞추기

메타트론의 다음 단계

메타트론은 이제 시작에 불과합니다.

  • 멀티모달 안전 감사: 사용자는 실제 실험실 설정 사진을 업로드하고 Gemini의 멀티모달 기능을 활용한 AI 기반 즉시 안전 피드백을 받을 수 있습니다.
  • 자율 주행 실험실: IoT 디바이스와 VR 실험 장비와의 통합을 통해 메타트론을 실제 물리적 연구 파트너로 변모시킵니다.
  • 증강 현실 (AR): 분자 시각화, 단계별 실험 안내, 실시간 안전 경고를 물리적 실험실 환경에 직접 오버레이합니다.

읽어 주셔서 감사합니다 🧠🧪

궁금하신 점이나 피드백, 아이디어는 언제든 환영합니다.

0 조회
Back to Blog

관련 글

더 보기 »

노트북 GPU의 숨겨진 힘을 풀어내기

개요 대부분의 최신 노트북은 강력한 GPU를 탑재하고 있지만, 이를 충분히 활용하지 못하는 경우가 많습니다. 소프트웨어 엔지니어로서 로컬 LLM을 실행하든, 데이터 사이언티스트이든...