[Paper] CTest-Metric: CT 보고서 생성 메트릭의 임상 타당성을 평가하는 통합 프레임워크
생성 AI 시대에, 중요한 의료 작업조차 점점 자동화되는 가운데, radiology report generation (RRG)은 여전히 최적이 아닌 metric에 의존하고 있다.
생성 AI 시대에, 중요한 의료 작업조차 점점 자동화되는 가운데, radiology report generation (RRG)은 여전히 최적이 아닌 metric에 의존하고 있다.
비전-언어 모델(VLMs)이 점점 더 복잡하고 멀티모달 작업을 수행함에 따라, 키-밸류(KV) 캐시의 급격한 성장으로 인해 상당한 메모리와 컴퓨…
Information overload와 misinformation은 대규모 news collections에서 의미 있는 narratives를 추출하는 데 큰 도전을 야기합니다. 이 논문은 na...
Retrieval-Augmented Generation (RAG)은 대형 언어 모델의 질문‑응답 능력을 통합을 통해 향상시키는 강력한 접근법으로 부상했습니다.
대형 언어 모델(LLMs)은 다양한 분야에서 뛰어난 성능을 보여주지만, 중요한 안전 문제에 직면해 있습니다. 모델 편집은 …
우리는 대부분 또는 모든 내용어가 무작위로 …된 'Jabberwocky' 언어를 이해하는 대형 언어 모델(LLMs)의 놀라운 능력에 대해 보고한다.
PubMed-OCR는 PubMed Central Open Access PDF에서 파생된 과학 논문들의 OCR 중심 코퍼스입니다. 각 페이지 이미지에는 Google Cloud Vision을 사용하여 주석이 달려 있습니다.
Large Language Models (LLMs)이 자율 에이전트로 진화하면서 AI 코딩의 범위가 국지적인 코드 생성에서 복잡한, 저장소 기반 …
Tool-Integrated Reasoning (TIR)은 대형 언어 모델(LLMs)이 추론 단계와 외부 도구 상호작용을 교차시켜 복잡한 작업을 수행하도록 지원합니다.
대규모 언어 모델을 long-horizon, goal-oriented interactions에 배치하는 것은 여전히 어려운 과제이다. 이는 유사한 엔터티와 사실이 서로 다른 latent …
Concept-based explanations는 고수준 개념(예: gender 또는 experience)이 모델 행동에 미치는 영향을 정량화하며, 이는 decision-makers에게 매우 중요합니다.
주장적인 텍스트에서 설득을 감지하는 것은 인간 커뮤니케이션을 이해하는 데 중요한 함의를 가진 도전적인 과제입니다. 이 연구는 r...