[Paper] 전 세계적으로 탐색: Deep Research AI Agents for Drug Asset Scouting in Investing, Business Development, and Search & Evaluation

발행: 3일 전 (2026년 2월 17일 오전 03:57 GMT+9)

9 분 소요

원문: arXiv

Source: arXiv - 2602.15019v1

개요

이 논문은 Bioptic을 소개한다. 이는 트리 구조를 가진 자체 학습 AI 에이전트로, 방대한 다국어 및 종종 비영어인 과학 및 특허 문헌에 숨겨진 약물 개발 자산을 탐색하도록 설계되었다. 주요 LLM 기반 연구 도구와 벤치마킹함으로써, 저자들은 Bioptic이 회상율을 크게 향상시키면서 환각을 방지할 수 있음을 보여준다—이는 경쟁자보다 먼저 “레이다 아래” 바이오테크 기회를 포착해야 하는 투자자, 사업 개발 팀, 벤처 캐피털리스트에게 필수적인 능력이다.

핵심 기여

실제 투자자 질의를 시뮬레이션하고, 다국어를 혼합하며, 전문가 의견에 맞춰 보정된 LLM‑as‑judge 점수를 사용하는 신약‑자산 탐색을 위한 새로운 벤치마킹 프레임워크.
Bioptic Agent 아키텍처: 거친 수준의 검색과 세밀한 검증을 결합하여 환각 없이 높은 재현율을 달성하는 트리 기반 자체 학습 “bioptic”(이중‑시야) 시스템.
다섯 가지 최첨단 연구 에이전트(Claude Opus 4.6, GPT‑5.2 Pro, Gemini 3 Pro + Deep Research, Perplexity Deep Research, Exa Websets)를 대상으로 한 포괄적인 실증 평가.
컴퓨팅 규모 확대(검색 횟수 증가, 더 큰 모델 추론)가 이 작업에서 급격한 성능 향상을 가져온다는 증거.
실제 투자자 스크리닝 프롬프트에서 벤치마크 질의를 생성하는 오픈소스 준비 파이프라인으로, 재현성과 향후 확장을 가능하게 함.

방법론

Query Collection – 팀은 바이오텍 투자자, 사업‑개발(BD) 전문가, 그리고 벤처 캐피털리스트로부터 실제 스크리닝 프롬프트를 수집했습니다. 이러한 프롬프트는 자산 스카우팅의 복잡하고 다중 기준 특성을 반영하는 “priors” 역할을 합니다.
Synthetic Benchmark Generation – priors를 활용해 조건부 언어 모델이 현실적이고 다국어 검색 쿼리의 대규모 집합을 생성합니다. 각 쿼리는 전형적인 미국 중심 레이더 밖에 있는 약물 자산(예: 중국 특허, 비영어 학회 논문)의 실제 정답 목록과 짝을 이룹니다.
Bioptic Agent Design –
- Coarse Retrieval Layer: 특허 데이터베이스, 지역 학술지, 프리프린트 서버 등 이질적인 데이터 소스를 다중 언어 임베딩으로 트리 구조 검색합니다.
- Fine Verification Layer: 2단계 LLM이 각 후보를 원본 문서와 대조해 검증하고, 환각되었거나 관련 없는 결과를 필터링합니다.
- Self‑Learning Loop: 검증 레이어의 피드백이 검색 가중치를 업데이트하여, 인간이 재라벨링하지 않아도 시스템이 시간이 지남에 따라 개선됩니다.
Evaluation – 전문가 주석으로 보정된 LLM‑as‑judge 모델이 벤치마크 상 각 시스템의 정밀도, 재현율, F1 점수를 평가합니다.

결과 및 발견

System	F1 Score
Bioptic Agent	79.7 %
Claude Opus 4.6	56.2 %
Gemini 3 Pro + Deep Research	50.6 %
GPT‑5.2 Pro	46.6 %
Perplexity Deep Research	44.2 %
Exa Websets	26.9 %

Recall boost: Bioptic은 숨겨진 자산의 거의 80 %를 회복하며, 가장 강력한 베이스라인 대비 20 % 이상의 절대적 향상을 보입니다.
Hallucination control: 검증 레이어가 거짓 양성을 크게 감소시켜, 리콜이 상승해도 정밀도를 높게 유지합니다.
Compute scaling: 더 많은 검색 패스(즉, 더 깊은 트리 탐색)를 추가하면 F1이 거의 선형적으로 개선되어, 컴퓨팅 예산을 커버리지와 교환할 수 있음을 확인합니다.

실용적 함의

Accelerated deal sourcing – 투자 팀은 전 세계 특허 및 문헌 피드의 1차 스캔을 자동화하여 수동 탐색보다 몇 주 앞서 유망한 후보를 발굴할 수 있습니다.
Risk mitigation – 비영어 자산을 신뢰성 있게 발굴함으로써 기업은 가치 평가나 경쟁 포지셔닝에 영향을 미칠 수 있는 획기적인 기술을 놓칠 가능성을 줄입니다.
Integration‑friendly – 트리 기반 아키텍처를 마이크로서비스로 래핑하여 기존 CRM, 딜‑플로우 플랫폼 또는 내부 지식 그래프에 연결할 수 있습니다.
Cost‑effective scaling – 성능이 컴퓨팅에 비례하므로 조직은 소규모 자원(예: 몇 대의 GPU)으로 시작해 파이프라인이 ROI를 입증함에 따라 확장할 수 있습니다.
Cross‑domain reuse – 바이옵틱 패턴(거친 검색 + 정밀 검증)은 규제 준수, 위협 인텔리전스, 과학 문헌 검토와 같은 고재현율·저환각 영역에도 적용됩니다.

제한 사항 및 향후 작업

데이터 최신성 – 벤치마크는 특허 및 출판 데이터베이스의 정적 스냅샷에 의존합니다; 실시간 업데이트(예: 새로 출원된 중국 특허)는 성능에 영향을 미칠 수 있습니다.
언어 범위 – 다국어 지원에도 불구하고 현재 시스템은 사전 학습된 임베딩이 풍부한 언어에 유리하게 작동합니다; 저자원 언어는 여전히 충분히 반영되지 않을 수 있습니다.
연산 비용 – 연산량을 늘릴수록 성능이 크게 향상되지만 운영 비용이 증가하여 소규모 기업에게는 부담이 될 수 있습니다.
인간이 참여하는 검증 – 연구에서는 전문가 수준으로 보정된 LLM 심판을 사용했지만, 도메인 전문가와의 전체 사용자 연구를 통해 실용성을 보다 정확히 정량화할 수 있습니다.
치료 효능으로의 확장 – 향후 작업에서는 임상 시험 결과와 같은 하위 데이터를 통합하여 자산을 단순히 찾는 것을 넘어 전이 가능성에 따라 순위를 매길 수 있도록 할 수 있습니다.

저자

Alisa Vinogradova
Vlad Vinogradov
Luba Greenwood
Ilya Yasny
Dmitry Kobyzev
Shoman Kasbekar
Kong Nguyen
Dmitrii Radkevich
Roman Doronin
Andrey Doronichev

논문 정보

arXiv ID: 2602.15019v1
분류: cs.AI, cs.IR
출판일: 2026년 2월 16일
PDF: PDF 다운로드

[Paper] 전 세계적으로 탐색: Deep Research AI Agents for Drug Asset Scouting in Investing, Business Development, and Search & Evaluation

개요

핵심 기여

방법론

결과 및 발견

실용적 함의

제한 사항 및 향후 작업

저자

논문 정보

관련 글

지식 내재형 잠재 투영을 통한 강인한 표현 학습

[Paper] 보안 에이전틱 시스템을 위한 정책 컴파일러

[Paper] 2025년 중반 LLM-Assistance가 생물학 초보자 성과에 미치는 영향 측정

[Paper] 머신 언러닝에서 삭제되지 않은 데이터 보호