AI 화학자가 거의 자율적으로 어려운 의약화학 반응을 개선

발행: 1일 전 (2026년 6월 17일 PM 07:00 GMT+9)

11 분 소요

출처: OpenAI 블로그

오픈AI의 과학 연구는 간단한 믿음에서 동기부여받는다: 고급 AI가 과학자들에게 강력한 파트너가 되어 더 많은 아이디어를 탐구하고, 먼 개념을 연결하며, 보다 나은 실험을 설계하고, 인류에게 이로운 발견을 가속화할 수 있다는 것이다. 우리는 이미 모델이 수학 분야에서 새로운 결과를 얻은 초기 사례를 공유했으며, 여기에는 단위 거리 문제, 이론 물리학에서는 글론 전이에 대한 새로운 결과, 생물학 분야에서는 GPT‑5가 자유 세포 내 단백질 합성 비용을 낮춤을 자동화된 실험실에서 도왔다는 사례가 있다. 또한 우리는 GPT‑Rosalind라는 목적을 위해 구축된 모델을 소개했으며, 이 모델은 생명 과학 연구 및 약물 발견 워크플로우를 지원하도록 설계되었다.

이 프로젝트는 추론만으로 측정할 수 없는 의약 화학 분야로 궤적을 연장한다. 가설은 실제 분자, 장비, 실험 노이즈가 존재하는 laboratoire에서 검증되어야 한다. Molecule.one과 협력하여, 우리는 GPT‑5.4를 Maria(자율 연구를 위한 고-throughput 실험실과 통합된 에이전트형 화학 AI)와 연결하고, 다양한 중요한 반응 클래스를 개선하는 오픈-엔딩 목표를 부여했다. 시스템은 연구 제안을 생성하고, 실험을 설계·실행하며, 실험 데이터를 분석하고, 후속 실험을 제안한다. 인간은 스티어링 및 등급 평가 프롬프트를 설계하고, 테스트할 제안을 선택함으로써 루프에 남아 있다. 또한 실험 계획에 제한적인 수정을 가하고, 기본 실험실 작업을 보조하며, 최종 결과를 독립적으로 검증했다.

가장 유망한 제안인 OAI‑M1‑03은 탄소-질소 결합을 형성하는 데 화학자들이 사용하는 어려운하지만 유용한 버전인 Chan–Lam 결합에 초점을 맞췄다. 프로세스 화학에서 Chan–Lam 결합을 개선하는 오픈-엔딩 목표를 시작으로, GPT‑5.4는 독립적으로 primary sulfonamides(주된 술폰아마이드)를 도전적이고 고가치의 기질 클래스로 식별하고, TEMPO와 같은 온화한 산화제가 반응을 향상시킬 수 있음을 제안했다.

Maria Lab에서 두 번의 실험 사이클을 거치며 이 아이디어는 상당한 개선을 이끌어냈다. 최적화된 조건 하에서는 테스트된 붕소산(보론산) 88%와 술폰아마이드 83%의 수율이 향상되었다. 평균 수율이 16.6%에서 25.2%로 상승했으며, 30% 이상의 수율을 기록한 반응 비중은 15.6%에서 37.5%로 증가했다.

인간 화학자들은 대표적인 반응을 벤치 스케일에서 반복했다. 해당 실험은 미크로리터 규모 결과를 확인했으며, 14개 기질 쌍 중 11쌍에서 더 높은 수율을 보였고, 대부분 경우에 두 배 이상 증가했다. 이는 약물 화학자들이 미크로리터 스크리닝 실험뿐 아니라 약물 발견 과정에서 사용되는 실용적인 실험실 워크플로우에서도 반응이 작동하도록 필요로 한다는 점을 보여준다.

의화학 문제의 중요성

유기 화학은 모든 소분자 의약품과 농업, 전자기기, 신소재 분야 제품基礎를 이룬다. 반응은 다양한 시작 재료에 걸쳐 동일한 종류의 화학적 결합을 신뢰할 수 있게 만들 때 특히 유용하다. 반응이 저수율이나 과다한 부산물 생산으로 나타날 경우, 화학자들은 다른 경로 개발에 많은 시간과 노력을 기울여야 하거나 이미 유망한 분자를 포기해야 할 수 있다. 이로 인해 약물 발견 과정에서 합성 자체가 주요 병목이 된다: 과학자들은 자신이 만들 수 있거나 확보할 수 있는 분자만 테스트한다.

Chan–Lam 결합은 의약 화학에서 유용한데, 이는 탄소‑질소 결합을 형성하기 때문이다. 이 결합은 모든 분자 클래스에 동일하게 작동하지 않는다. 특히, primary sulfonamides(주된 술폰아마이드)와 붕소산을 결합할 때는 전통적으로 저수율을 보였다. 술폰아마이드는 암 치료 및 전염병 치료에 사용되는 의약품에 등장하는 중요한 분자군이다. 이 반응 형태를 보다 신뢰할 수 있게 만들면 약물 화학자들은 보다 넓고 실용적인 방법으로 유망한 분자를 생산하고 탐구할 수 있다.

GPT‑5.4와 Maria AI 및 Lab 연결

통합된 시스템은 보완적인 능력을 pairing(ペ어링)했다. Maria AI와 작업하는 과학자들이 작성한 프롬프트를 GPT‑5.4와 결합하여 수천 개의 가능한 연구 제안을 생성하고 순위 매겼다. 인간 화학자들은 시스템에 의해 상위 순위로 지정된 작은 부분의 제안들을 검토하고, 실험실 테스트를 위해 네 개를 선택했다. Maria AI는 선정된 고수준 계획을 상세한 실험실 지침으로 번역하고, 수천 개의 고-throughput 실험을 실행하며 원시 데이터를 분석하고 구조화된 결과를 GPT‑5.4에 반환했다.

네 개 중 하나인 OAI‑M1‑03은 TEMPO와 같은 온화한 산화제를 사용해 술폰아마이드 합성에 대한 Chan–Lam 반응 성능을 향상시킬 것을 제안했다. 화학자들은 이 제안을 놀랍고 흥미로운 것으로 여겼다. OAI‑M1‑03의 상세한 결과는 이번 블로그 포스트와 논문에서 공유한다.

최종 연구 제안은 Maria에 의해 실험용 그리드를 생성하는 데 사용되었으며, 인간에 의한 미세한 수정이 가해졌다. 가장 큰 인간 수정은 디메틸 술포옥시드(DMSO)를 용매로 피해야 한다는 것이었다. 이는 강한 산화제와 반응할 우려가 있었기 때문이다.

전체 과정은 3개월이 걸렸으며, 3월 4일 첫 프롬프트부터 독립적인 전문가들에게 OAI‑M1‑03 결과를 공유하는 6월 4일까지 이어졌다. 우리는 이 워크플로를 완전 자율이 아닌 근접 자동화(near-autonomous)라고 descripe한다. 모델은 핵심 연구 아이디어를 제안했으며, 인간 화학자들은 전반적인 방향 설정과 판단, 실험 세부 수정, 실험소모품 및 시약 준비 보조, 그리고 직접 핵심 실험을 반복하는 등 중요한 결정을 내렸다.

우리가 발견한 것

OAI‑M1‑03은 여기서 연구한 primary sulfonamide Chan–Lam 결합에 유용한 첨가물인 TEMPO를 식별했다. 최적화된 조건 하에서는 반응이 두 가지 측면에서 개선되었다: 평균 수율이 상승했고, 실용적인 수준의 수율을 기록한 기질 조합 비중도 증가했다.

두 번의 사이클 동안 Maria는 총 10,080개의 반응을 실행했으며, 하루에 세 개씩 진행하는 화학자가 십년 동안 수행할 수 있는 양이었다. 이 규모가 중요했다 porque 실험 결과는 제한된 예시만 테스트될 경우 오해의 소지가 있다. 한 쌍의 시작 재료만에 promising하게 보일 수 있지만, 더 넓은 분자 집합에서는 실패할 수 있다. 수천 개의 반응을 통해 테스트된 열 가지 산화제 중 TEMPO를 식별할 수 있었다.

AI 화학자가 거의 자율적으로 어려운 의약화학 반응을 개선

관련 글

ChatGPT의 건강 지능 향상

LifeSciBench 소개

배포 시뮬레이션으로 출시 전 모델 행동 예측

MosaicLeaks: 연구 에이전트가 비밀을 지킬 수 있나요?