[Paper] 多模态 LLMs 用于从档案图像扫描构建历史数据集:德国专利(1877-1918)
我们利用多模态大型语言模型(LLMs),从 9,562 张档案图像扫描中构建了一个包含 306,070 项德国专利(1875‑1918)的数据集,使用我们的 LLM‑b…
我们利用多模态大型语言模型(LLMs),从 9,562 张档案图像扫描中构建了一个包含 306,070 项德国专利(1875‑1918)的数据集,使用我们的 LLM‑b…
现有的强化学习(RL)方法将大型语言模型(LLMs)视为单一统一的策略,忽视了它们的内部机制。了解…
糖尿病视网膜病变(DR)是全球可预防失明的主要原因之一,需要准确的自动化诊断系统。虽然通用领域的视觉‑la…
设计高效、有效且一致的 metric clustering algorithms 是一个受到日益关注的重大挑战。传统方法关注……
Aspect-Category Sentiment Analysis (ACSA) 提供细粒度洞察,通过识别评论中的具体主题及其相关情感。While supervi...
我们引入了一种新颖的 deep learning 算法,用于计算可微凸函数的 convex conjugates,这是一种在 convex analysis 中的基本操作,...
编程对现代科学研究至关重要,但大多数科学家报告称,他们在工作所需的软件开发方面的培训不足。Generati...
数值模拟时变偏微分方程(PDE)是科学和工程应用的核心,但高保真求解器……
我们展示了关于 diacritic restoration 的实验,这是一种对自然语言处理 (NLP) 任务至关重要的 text normalization 形式。我们的研究聚焦于两个 ex...
摘要评估涉及评估生成的摘要在多大程度上反映了源文本的关键思想和意义,这需要对……有深入的理解。
本文介绍了 MauBERT,这是一种 HuBERT 的多语言扩展,利用 articulatory features 实现稳健的跨语言语音表征学习……
虽然Multimodal Large Language Models在许多visual和textual reasoning tasks上已经达到了类人水平的表现,但它们在细粒度spatial…