[Paper] 전 세계적으로 탐색: Deep Research AI Agents for Drug Asset Scouting in Investing, Business Development, and Search & Evaluation
Source: arXiv - 2602.15019v1
개요
이 논문은 Bioptic을 소개한다. 이는 트리 구조를 가진 자체 학습 AI 에이전트로, 방대한 다국어 및 종종 비영어인 과학 및 특허 문헌에 숨겨진 약물 개발 자산을 탐색하도록 설계되었다. 주요 LLM 기반 연구 도구와 벤치마킹함으로써, 저자들은 Bioptic이 회상율을 크게 향상시키면서 환각을 방지할 수 있음을 보여준다—이는 경쟁자보다 먼저 “레이다 아래” 바이오테크 기회를 포착해야 하는 투자자, 사업 개발 팀, 벤처 캐피털리스트에게 필수적인 능력이다.
핵심 기여
- 실제 투자자 질의를 시뮬레이션하고, 다국어를 혼합하며, 전문가 의견에 맞춰 보정된 LLM‑as‑judge 점수를 사용하는 신약‑자산 탐색을 위한 새로운 벤치마킹 프레임워크.
- Bioptic Agent 아키텍처: 거친 수준의 검색과 세밀한 검증을 결합하여 환각 없이 높은 재현율을 달성하는 트리 기반 자체 학습 “bioptic”(이중‑시야) 시스템.
- 다섯 가지 최첨단 연구 에이전트(Claude Opus 4.6, GPT‑5.2 Pro, Gemini 3 Pro + Deep Research, Perplexity Deep Research, Exa Websets)를 대상으로 한 포괄적인 실증 평가.
- 컴퓨팅 규모 확대(검색 횟수 증가, 더 큰 모델 추론)가 이 작업에서 급격한 성능 향상을 가져온다는 증거.
- 실제 투자자 스크리닝 프롬프트에서 벤치마크 질의를 생성하는 오픈소스 준비 파이프라인으로, 재현성과 향후 확장을 가능하게 함.
방법론
-
Query Collection – 팀은 바이오텍 투자자, 사업‑개발(BD) 전문가, 그리고 벤처 캐피털리스트로부터 실제 스크리닝 프롬프트를 수집했습니다. 이러한 프롬프트는 자산 스카우팅의 복잡하고 다중 기준 특성을 반영하는 “priors” 역할을 합니다.
-
Synthetic Benchmark Generation – priors를 활용해 조건부 언어 모델이 현실적이고 다국어 검색 쿼리의 대규모 집합을 생성합니다. 각 쿼리는 전형적인 미국 중심 레이더 밖에 있는 약물 자산(예: 중국 특허, 비영어 학회 논문)의 실제 정답 목록과 짝을 이룹니다.
-
Bioptic Agent Design –
- Coarse Retrieval Layer: 특허 데이터베이스, 지역 학술지, 프리프린트 서버 등 이질적인 데이터 소스를 다중 언어 임베딩으로 트리 구조 검색합니다.
- Fine Verification Layer: 2단계 LLM이 각 후보를 원본 문서와 대조해 검증하고, 환각되었거나 관련 없는 결과를 필터링합니다.
- Self‑Learning Loop: 검증 레이어의 피드백이 검색 가중치를 업데이트하여, 인간이 재라벨링하지 않아도 시스템이 시간이 지남에 따라 개선됩니다.
-
Evaluation – 전문가 주석으로 보정된 LLM‑as‑judge 모델이 벤치마크 상 각 시스템의 정밀도, 재현율, F1 점수를 평가합니다.
결과 및 발견
| System | F1 Score |
|---|---|
| Bioptic Agent | 79.7 % |
| Claude Opus 4.6 | 56.2 % |
| Gemini 3 Pro + Deep Research | 50.6 % |
| GPT‑5.2 Pro | 46.6 % |
| Perplexity Deep Research | 44.2 % |
| Exa Websets | 26.9 % |
- Recall boost: Bioptic은 숨겨진 자산의 거의 80 %를 회복하며, 가장 강력한 베이스라인 대비 20 % 이상의 절대적 향상을 보입니다.
- Hallucination control: 검증 레이어가 거짓 양성을 크게 감소시켜, 리콜이 상승해도 정밀도를 높게 유지합니다.
- Compute scaling: 더 많은 검색 패스(즉, 더 깊은 트리 탐색)를 추가하면 F1이 거의 선형적으로 개선되어, 컴퓨팅 예산을 커버리지와 교환할 수 있음을 확인합니다.
실용적 함의
- Accelerated deal sourcing – 투자 팀은 전 세계 특허 및 문헌 피드의 1차 스캔을 자동화하여 수동 탐색보다 몇 주 앞서 유망한 후보를 발굴할 수 있습니다.
- Risk mitigation – 비영어 자산을 신뢰성 있게 발굴함으로써 기업은 가치 평가나 경쟁 포지셔닝에 영향을 미칠 수 있는 획기적인 기술을 놓칠 가능성을 줄입니다.
- Integration‑friendly – 트리 기반 아키텍처를 마이크로서비스로 래핑하여 기존 CRM, 딜‑플로우 플랫폼 또는 내부 지식 그래프에 연결할 수 있습니다.
- Cost‑effective scaling – 성능이 컴퓨팅에 비례하므로 조직은 소규모 자원(예: 몇 대의 GPU)으로 시작해 파이프라인이 ROI를 입증함에 따라 확장할 수 있습니다.
- Cross‑domain reuse – 바이옵틱 패턴(거친 검색 + 정밀 검증)은 규제 준수, 위협 인텔리전스, 과학 문헌 검토와 같은 고재현율·저환각 영역에도 적용됩니다.
제한 사항 및 향후 작업
- 데이터 최신성 – 벤치마크는 특허 및 출판 데이터베이스의 정적 스냅샷에 의존합니다; 실시간 업데이트(예: 새로 출원된 중국 특허)는 성능에 영향을 미칠 수 있습니다.
- 언어 범위 – 다국어 지원에도 불구하고 현재 시스템은 사전 학습된 임베딩이 풍부한 언어에 유리하게 작동합니다; 저자원 언어는 여전히 충분히 반영되지 않을 수 있습니다.
- 연산 비용 – 연산량을 늘릴수록 성능이 크게 향상되지만 운영 비용이 증가하여 소규모 기업에게는 부담이 될 수 있습니다.
- 인간이 참여하는 검증 – 연구에서는 전문가 수준으로 보정된 LLM 심판을 사용했지만, 도메인 전문가와의 전체 사용자 연구를 통해 실용성을 보다 정확히 정량화할 수 있습니다.
- 치료 효능으로의 확장 – 향후 작업에서는 임상 시험 결과와 같은 하위 데이터를 통합하여 자산을 단순히 찾는 것을 넘어 전이 가능성에 따라 순위를 매길 수 있도록 할 수 있습니다.
저자
- Alisa Vinogradova
- Vlad Vinogradov
- Luba Greenwood
- Ilya Yasny
- Dmitry Kobyzev
- Shoman Kasbekar
- Kong Nguyen
- Dmitrii Radkevich
- Roman Doronin
- Andrey Doronichev
논문 정보
- arXiv ID: 2602.15019v1
- 분류: cs.AI, cs.IR
- 출판일: 2026년 2월 16일
- PDF: PDF 다운로드