[Paper] SumTablets:苏美尔泥板的音译数据集
苏美尔文字转写是一种传统系统,用于用拉丁字母表示学者对泥板的解释。多亏了有远见的数字亚述…
3122 posts from this source
苏美尔文字转写是一种传统系统,用于用拉丁字母表示学者对泥板的解释。多亏了有远见的数字亚述…
生成式人工智能(GenAI)的进步促使开发出多种保护策略,以防止图像的未经授权使用。这些方法依赖于...
Sybil resistance 是去中心化共识协议的关键要求。它通过引入稀缺资源(例如计算能力、moneta……)来实现。
我们研究如何进行推理,以访问存储在语言模型参数中的世界知识。例如,回忆堪培拉是澳大利亚的首都可能有益……
开源原生 GUI 代理在长期导航任务上仍落后于闭源系统。这一差距源于两个限制:高‑q…
建模岩石‑流体相互作用需要求解一组偏微分方程(PDE),以预测流体的流动行为以及流体与岩石的反应。
在过去的二十年里,Question Answering(QA)系统的设计和实现取得了显著进展。然而,针对复杂的…
在许多应用中,识别生存时间比总体更长或更短的子群体非常重要。例如,在医学领域,……
近年来,出现了一种标准的计算病理工作流程,将 whole slide images 裁剪成 tiles,这些 tiles 使用一个 foun...
Checkpointing 对于在训练大型语言模型(LLMs)时实现容错至关重要。然而,现有方法无论其 I/O 策略如何,周期性……
大多数当代神经学习系统依赖于基于 epoch 的优化和对历史数据的重复访问,隐含地假设计算是可逆的。我...
人类反馈强化学习(RLHF)在使大型语言模型(LLMs)符合人类偏好方面发挥了重要作用。虽然RLHF与实验…
大型语言模型(LLMs)正日益被用于“专业化”职场沟通,但往往以牺牲语言身份为代价。我们引入“Cultu…”。
对象幻觉是大型视觉语言模型(LVLMs)的一个关键问题,模型的输出可能包含输入图像中不存在的对象。一个自然…
医学视觉语言预训练越来越依赖医学报告作为大规模监督信号;然而,原始报告往往表现出显著的 st...
最近在 Multimodal Large Language Models 方面的进展大幅提升了视觉理解和推理能力,然而它们的 quadratic attention 和 offline training …
Deep neural networks (DNNs) 对于在边缘或移动设备上执行高级任务至关重要,但它们的部署常常受到严重资源限制的阻碍。
我们研究在均值偏移污染存在的情况下的均值估计基本任务。在 mean-shift contamination 模型中,对手被允许替换…
Instruction-following benchmarks 仍然主要以 English‑centric 为主,导致对数以亿计的 Indic language speakers 存在关键的 evaluation gap。
Small language models(SLMs)在成本、延迟和适应性方面具有显著优势,但在长时程软件任务上仍落后于更大的模型。
理解学习到的分布的几何结构对于改进和解释扩散模型至关重要,然而系统性的工具用于探索它们的…
现代计算系统中硬件加速器的日益增长的复杂性和多样性,需要灵活、低开销的程序分析工具。我们提出了 PA...
本文使用 agile 词汇解释 Visual Milestone Planning (VMP) 方法,以促进 agile 从业者将其作为 … 的 front end。
随着 HPC 存储栈的复杂性快速增长,领域科学家在有效利用 HPC 存储系统以实现 t... 方面面临日益增长的挑战。