[Paper] Multimodal LLMs를 활용한 아카이브 이미지 스캔으로부터의 역사적 데이터셋 구축: 독일 특허 (1877-1918)
우리는 멀티모달 대형 언어 모델(LLMs)을 활용하여 9,562개의 아카이브 이미지 스캔을 통해 306,070개의 독일 특허(1877‑1918) 데이터셋을 우리 LLM‑b를 사용해 구축합니다.
우리는 멀티모달 대형 언어 모델(LLMs)을 활용하여 9,562개의 아카이브 이미지 스캔을 통해 306,070개의 독일 특허(1877‑1918) 데이터셋을 우리 LLM‑b를 사용해 구축합니다.
기존의 강화 학습(RL) 접근 방식은 대형 언어 모델(LLM)을 단일 통합 정책으로 취급하여 내부 메커니즘을 간과한다. 이해...
당뇨병성 망막증(DR)은 전 세계적으로 예방 가능한 실명의 주요 원인 중 하나이며, 정확한 자동 진단 시스템이 요구됩니다. 일반 도메인 비전‑la…
효율적이고 효과적이며 일관된 metric clustering algorithms를 설계하는 것은 점점 더 많은 관심을 끄는 중요한 과제입니다. 전통적인 접근 방식은 ...
Aspect-Category Sentiment Analysis (ACSA)는 리뷰 내의 특정 주제를 식별하고 해당 감정을 파악함으로써 세분화된 인사이트를 제공합니다. While supervi...
우리는 미분 가능한 볼록 함수의 convex conjugates를 계산하기 위한 새로운 딥러닝 알고리즘을 소개합니다. 이는 convex analysis에서 기본적인 연산입니다.
프로그래밍은 현대 과학 연구에 필수적이지만, 대부분의 과학자들은 자신의 업무에 필요한 소프트웨어 개발에 대한 충분한 교육을 받지 못했다고 보고합니다. Generati...
시간에 의존하는 편미분 방정식(PDE)의 수치 시뮬레이션은 과학 및 공학 응용 분야의 핵심이지만, 고정밀 솔버는…
우리는 자연어 처리(NLP) 작업에 필수적인 텍스트 정규화의 한 형태인 diacritic restoration에 대한 실험을 제시합니다. 우리의 연구는 두 가지 예...
Summary assessment는 생성된 summary가 source text의 핵심 아이디어와 의미를 얼마나 잘 반영하는지를 평가하는 것으로, 깊은 이해가 필요합니다.
이 논문은 HuBERT의 다국어 확장인 MauBERT를 소개하며, 조음 특징을 활용하여 강인한 다언어 음성 표현 학습을 수행한다.
멀티모달 대형 언어 모델은 많은 시각 및 텍스트 추론 작업에서 인간과 같은 성능을 달성했지만, 세밀한 공간…