[Paper] FLEX:利用 FPGA‑CPU 协同加速 Mixed-Cell-Height Legalization
在本工作中,我们提出了 FLEX,一种用于混合单元高度合法化任务的 FPGA‑CPU 加速器。我们从以下几个方面来解决挑战。首先,w...
4797 posts from this source
在本工作中,我们提出了 FLEX,一种用于混合单元高度合法化任务的 FPGA‑CPU 加速器。我们从以下几个方面来解决挑战。首先,w...
图上的机器学习最近在多个领域取得了显著的进展,包括分子属性预测和芯片设计。然而,基准…
日志解析将原始日志转换为包含常量和变量的结构化模板。它是异常检测、故障诊断以及其他 AIOps 的基础。
基于 CXL 的计算存储(CCM)在扩展的远程内存中实现近内存处理,提供了解决数据移动成本相关问题的机会……
工作流自动化有望在日常文档相关任务中带来显著的生产力提升。虽然之前的 agentic 系统可以执行孤立的指令,t...
Spiking Neural Networks (SNNs) 由于其稀疏二进制激活,提供了一种有前景且节能的传统神经网络替代方案。How...
Hallucinations 是在创建依赖 Foundation models (FMs) 的应用时的关键关注点。了解这些细微失效在何处以及如何发生是……
在稀疏 LU 分解中,符号分解后的非零元素往往分布在稀疏矩阵的对角线和右下区域。然而,重新…
现代 GPU 软件栈要求开发者在实际启动 kernel 之前就能预判性能瓶颈;误判 floating-point 工作负载会导致……
随着现代并行机器的复杂性和规模不断增长,程序员越来越依赖软件库的组合来封装和…
参数高效微调(PEFT)通过仅更新大型预训练模型中一小部分参数,提供了一种可扩展的全模型适配替代方案。
Aurora 超级计算机于 2024 年部署在 Argonne National Laboratory,目前是全球 Top500 列表中三台 Exascale 机器之一。
我们提出了 tritonBLAS,一个快速且确定性的分析模型,利用诸如缓存层次结构以及相对代码和数据放置等架构参数,……
Normalizing Flows (NFs) 学习数据与高斯分布之间的可逆映射。先前的工作通常存在两个限制。首先,它们添加……
我们引入了“single-life”学习范式,在该范式中,我们仅在由单个人拍摄的第一人称视频上训练一个独特的vision model。我们leverag...
Graphic design 是现代视觉传播的基石,作为推广文化和商业活动的重要媒介。最近的进展已经…
我们引入 radiance meshes,这是一种使用通过 Delaunay tetrahedralization 生成的恒定密度 tetrahedral cells 来表示 radiance fields 的技术。
Reasoning models leveraging long chains of thought 采用多种认知技能,例如对其答案的 verification、backtracking、通过 alternat… 重试。
Vision Language Models (VLMs) 展示了强大的定性视觉理解能力,但在实现具身所需的度量精确空间推理方面仍然困难……
为了处理不明确或模糊的查询,AI 助手需要一套管理其不确定性的策略,以确定 (a) 何时猜测用户意图并回答…
在当今不断发展的世界中,拥有像Ola、Uber和Rapido这样的优质叫车服务非常重要,因为它们对我们的日常出行至关重要。...
Network Interface Cards (NICs) 是现代互联网的关键推动因素之一。它们充当将计算设备连接到网络的网关,用于...
现代深度学习模型需要巨大的计算资源,这推动了对低精度训练的研究。量化训练通过……
手语生成(Sign Language Production,SLP)是将复杂的输入文本转换为真实视频的过程。大多数以往的工作集中在 Text2Gloss、Gloss2Pose 等方面,……
在民主制度中,重大政策决定通常需要某种形式的多数或共识,因此精英必须争取大众支持以执政。历史上,精英……
Watermarking 的目标是将隐藏信号嵌入生成的文本中,在获取到秘密密钥时能够可靠地检测到。Open-weight 语言模型带来…
真正的交互式世界模型需要三个关键要素:real-time long-horizon streaming、一致的spatial memory,以及精确的user control。然而,...
本论文在两个主要领域提出了新颖的贡献:提升生成模型的效率,特别是 normalizing flows,以及应用 gener...
为什么当模型在单域数据集上训练时,最先进的 OOD 检测方法会表现出灾难性失败?我们提供了第一个理论…
我们提出 Jina-VLM,这是一款拥有 2.4B 参数的视觉语言模型,在开放的 2B 规模 VLM 中实现了最先进的多语言视觉问答。The ...
本研究探讨在特定情形下,大型语言模型(LLMs)相较于传统神经网络在天文数据处理方面是否具有优势。
注意力机制是基础模型的核心,但其二次复杂度仍然是扩展的关键瓶颈。这一挑战推动了……
Quantum key distribution (QKD) 的安全性根本依赖于区分真实的 quantum correlations 与 classical eavesdropper simulations 的能力,...
随着带有外部工具的增强型大型语言模型(LLMs)在网页应用中日益流行,提升增强型 LLM 推理服务的效率……
使用差分隐私(DP)进行训练为数据集中的成员提供了一种保证,即他们不能被已发布模型的用户识别。然而,尽管如此,...
草图是人类手绘的对复杂场景和现实世界物体的简化抽象。虽然草图表示学习领域已经取得了显著的进展……
Tokenizer 适配在将预训练语言模型转移到新领域或新语言中发挥重要作用。在本工作中,我们解决了两个互补的……
将大型语言模型(LLMs)适配到低资源语言仍然是一个重大挑战,因为数据稀缺和跨语言漂移。本工作提出了一种两…
我们考虑仅使用成员查询来主动学习未知的二叉决策树的问题,这是一种学习者必须对……
Mixture-of-Experts(MoE),虽然作为大型语言模型(LLM)架构提供了显著优势,但在部署到低…
基于SMT求解器的自动化验证工具在验证复杂软件系统方面取得了显著进展。然而,这些工具面临一个根本性的……
语言模型依赖于大规模的文本语料库,这些语料库通常会进行质量过滤,而这一过程可能会无意中排除非标准的语言变体……
人工智能(AI)和深度学习(DL)的快速发展催生了多个以优化为驱动的子领域,尤其是神经…
Spiking neural networks (SNNs) 已经成为计算神经科学和人工智能领域的一个有前景的方向,提供了诸如…的优势。
Transformer 解码器在各种任务中取得了强劲的结果,但 KV 缓存所需的内存在长序列长度下变得难以承受。虽然 …
机器学习在医学早期预测方面最近表现出突破性性能,然而,过于关注提升预测准确性导致了一个 …
现代软件系统日益给传统的代码库组织策略带来压力。Monorepos 提供一致性,但往往面临可扩展性问题……
本文讨论了在分析合成基准测试和 Gromacs 软件包在 Fritz 与 Alex HPC 系统上的能效时所遇到的挑战。