Source

arXiv

4797 posts from this source

排序:

5个月前 · devops · - · -

[Paper] FLEX：利用 FPGA‑CPU 协同加速 Mixed-Cell-Height Legalization

在本工作中，我们提出了 FLEX，一种用于混合单元高度合法化任务的 FPGA‑CPU 加速器。我们从以下几个方面来解决挑战。首先，w...

#research #paper #devops
5个月前 · ai · - · -

[Paper] GraphBench: 下一代图学习基准测试

图上的机器学习最近在多个领域取得了显著的进展，包括分子属性预测和芯片设计。然而，基准…

#research #paper #ai #machine-learning
5个月前 · software · - · -

[Paper] LLM‑SrcLog：通过大语言模型实现主动且统一的日志模板提取

日志解析将原始日志转换为包含常量和变量的结构化模板。它是异常检测、故障诊断以及其他 AIOps 的基础。

#research #paper #software
5个月前 · devops · - · -

[论文] 卸载到基于 CXL 的计算内存

基于 CXL 的计算存储（CCM）在扩展的远程内存中实现近内存处理，提供了解决数据移动成本相关问题的机会……

#research #paper #devops
5个月前 · ai · - · -

[Paper] 通过分步和回滚支持的操作编排实现复杂文档工作流自动化

工作流自动化有望在日常文档相关任务中带来显著的生产力提升。虽然之前的 agentic 系统可以执行孤立的指令，t...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] MD‑SNN：面向量化脉冲神经网络的膜电位感知蒸馏

Spiking Neural Networks (SNNs) 由于其稀疏二进制激活，提供了一种有前景且节能的传统神经网络替代方案。How...

#research #paper #ai
5个月前 · ai · - · -

[Paper] TaskEval：用于 Foundation-Model 任务的合成评估

Hallucinations 是在创建依赖 Foundation models (FMs) 的应用时的关键关注点。了解这些细微失效在何处以及如何发生是……

#research #paper #ai #machine-learning
5个月前 · devops · - · -

[Paper] 面向结构感知的不规则阻塞稀疏 LU 分解方法

在稀疏 LU 分解中，符号分解后的非零元素往往分布在稀疏矩阵的对角线和右下区域。然而，重新…

#research #paper #devops
5个月前 · ai · - · -

[Paper] 无需运行的计数：评估 LLM 对代码复杂度的推理

现代 GPU 软件栈要求开发者在实际启动 kernel 之前就能预判性能瓶颈；误判 floating-point 工作负载会导致……

#research #paper #ai #machine-learning
5个月前 · devops · - · -

[Paper] VLCs: 使用虚拟化库管理并行性

随着现代并行机器的复杂性和规模不断增长，程序员越来越依赖软件库的组合来封装和…

#research #paper #devops
5个月前 · ai · - · -

[Paper] GRASP：分组激活共享参数化用于参数高效微调和稳健推理的Transformer

参数高效微调（PEFT）通过仅更新大型预训练模型中一小部分参数，提供了一种可扩展的全模型适配替代方案。

#research #paper #ai #machine-learning
5个月前 · devops · - · -

[Paper] 在 Aurora 上扩展 MPI 应用

Aurora 超级计算机于 2024 年部署在 Argonne National Laboratory，目前是全球 Top500 列表中三台 Exascale 机器之一。

#research #paper #devops
5个月前 · devops · - · -

[Paper] tritonBLAS：基于 Triton 的 GEMM 核参数选择分析方法

我们提出了 tritonBLAS，一个快速且确定性的分析模型，利用诸如缓存层次结构以及相对代码和数据放置等架构参数，……

#research #paper #devops
5个月前 · ai · - · -

[Paper] SimFlow：简化的潜在归一化流端到端训练

Normalizing Flows (NFs) 学习数据与高斯分布之间的可逆映射。先前的工作通常存在两个限制。首先，它们添加……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 独特的生活，共享的世界：从单生命视频中学习

我们引入了“single-life”学习范式，在该范式中，我们仅在由单个人拍摄的第一人称视频上训练一个独特的vision model。我们leverag...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] PosterCopilot：面向专业平面设计的布局推理与可控编辑

Graphic design 是现代视觉传播的基石，作为推广文化和商业活动的重要媒介。最近的进展已经…

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 用于体积重建的 Radiance Meshes

我们引入 radiance meshes，这是一种使用通过 Delaunay tetrahedralization 生成的恒定密度 tetrahedral cells 来表示 radiance fields 的技术。

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] SkillFactory：Self-Distillation 用于学习认知行为

Reasoning models leveraging long chains of thought 采用多种认知技能，例如对其答案的 verification、backtracking、通过 alternat… 重试。

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] SpaceTools：工具增强的空间推理 via Double Interactive RL

Vision Language Models (VLMs) 展示了强大的定性视觉理解能力，但在实现具身所需的度量精确空间推理方面仍然困难……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 学习可操控的澄清策略与协作自我对弈

为了处理不明确或模糊的查询，AI 助手需要一套管理其不确定性的策略，以确定 (a) 何时猜测用户意图并回答…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Uber、Ola 和 Rapido 的票价比较应用

在当今不断发展的世界中，拥有像Ola、Uber和Rapido这样的优质叫车服务非常重要，因为它们对我们的日常出行至关重要。...

#research #paper #ai #machine-learning
5个月前 · it · - · -

[Paper] SmartNICs 演进的时间顺序分析

Network Interface Cards (NICs) 是现代互联网的关键推动因素之一。它们充当将计算设备连接到网络的网关，用于...

#SmartNIC #DPU #network acceleration #data center hardware #programmable NIC
5个月前 · ai · - · -

[Paper] 离散参数更新的收敛性

现代深度学习模型需要巨大的计算资源，这推动了对低精度训练的研究。量化训练通过……

#discrete optimization #low-precision training #multinomial update #convergence theory #deep learning
5个月前 · ai · - · -

[Paper] Stable Signer: 层次化手语生成模型

手语生成（Sign Language Production，SLP）是将复杂的输入文本转换为真实视频的过程。大多数以往的工作集中在 Text2Gloss、Gloss2Pose 等方面，……

#research #paper #ai #nlp #computer-vision
5个月前 · ai · - · -

[论文] 设计式极化：当 AI 降低说服成本时，精英如何塑造大众偏好

在民主制度中，重大政策决定通常需要某种形式的多数或共识，因此精英必须争取大众支持以执政。历史上，精英……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] MarkTune：在开放权重 LLM 水印中改进质量‑可检测性权衡

Watermarking 的目标是将隐藏信号嵌入生成的文本中，在获取到秘密密钥时能够可靠地检测到。Open-weight 语言模型带来…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] RELIC：交互式视频世界模型与长时程记忆

真正的交互式世界模型需要三个关键要素：real-time long-horizon streaming、一致的spatial memory，以及精确的user control。然而，...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 快速且高效的 Normalizing Flows 及图像生成模型的应用

本论文在两个主要领域提出了新颖的贡献：提升生成模型的效率，特别是 normalizing flows，以及应用 gener...

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] Domain Feature Collapse：对Out-of-Distribution Detection的影响及解决方案

为什么当模型在单域数据集上训练时，最先进的 OOD 检测方法会表现出灾难性失败？我们提供了第一个理论…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Jina-VLM：小型多语言视觉语言模型

我们提出 Jina-VLM，这是一款拥有 2.4B 参数的视觉语言模型，在开放的 2B 规模 VLM 中实现了最先进的多语言视觉问答。The ...

#research #paper #ai #machine-learning #nlp #computer-vision
5个月前 · ai · - · -

[Paper] 大语言模型用于有限噪声数据：引力波识别研究

本研究探讨在特定情形下，大型语言模型（LLMs）相较于传统神经网络在天文数据处理方面是否具有优势。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] PSA：金字塔稀疏注意力用于高效视频理解与生成

注意力机制是基础模型的核心，但其二次复杂度仍然是扩展的关键瓶颈。这一挑战推动了……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] TARA Test-by-Adaptive-Ranks 用于量子异常检测的 Conformal Prediction 保证

Quantum key distribution (QKD) 的安全性根本依赖于区分真实的 quantum correlations 与 classical eavesdropper simulations 的能力，...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] AugServe：自适应请求调度用于增强大型语言模型推理服务

随着带有外部工具的增强型大型语言模型（LLMs）在网页应用中日益流行，提升增强型 LLM 推理服务的效率……

#LLM serving #adaptive scheduling #dynamic batching #inference optimization #augmented LLM
5个月前 · ai · - · -

[论文] 通过正则化实现私有ML的高效公开验证

使用差分隐私（DP）进行训练为数据集中的成员提供了一种保证，即他们不能被已发布模型的用户识别。然而，尽管如此，...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 关于草图表示学习的时序性

草图是人类手绘的对复杂场景和现实世界物体的简化抽象。虽然草图表示学习领域已经取得了显著的进展……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 教老 Tokenizer 新词：用于预训练模型的高效 Tokenizer 适配

Tokenizer 适配在将预训练语言模型转移到新领域或新语言中发挥重要作用。在本工作中，我们解决了两个互补的……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 将大型语言模型适配到低资源藏语：两阶段持续与监督微调研究

将大型语言模型（LLMs）适配到低资源语言仍然是一个重大挑战，因为数据稀缺和跨语言漂移。本工作提出了一种两…

#low-resource languages #LLM adaptation #continual pretraining #Tibetan NLP #translation
5个月前 · ai · - · -

[Paper] 决策树的近似最优主动学习

我们考虑仅使用成员查询来主动学习未知的二叉决策树的问题，这是一种学习者必须对……

#active learning #decision trees #SAT encoding #approximate model counting #model extraction
5个月前 · devops · - · -

[Paper] OD-MoE：按需专家加载用于无缓存边缘分布式 MoE 推理

Mixture-of-Experts（MoE），虽然作为大型语言模型（LLM）架构提供了显著优势，但在部署到低…

#research #paper #devops
5个月前 · software · - · -

[Paper] 可调自动化在自动化程序验证中

基于SMT求解器的自动化验证工具在验证复杂软件系统方面取得了显著进展。然而，这些工具面临一个根本性的……

#research #paper #software
5个月前 · ai · - · -

[Paper] BERnaT：巴斯克语编码器用于表示自然文本多样性

语言模型依赖于大规模的文本语料库，这些语料库通常会进行质量过滤，而这一过程可能会无意中排除非标准的语言变体……

#Basque NLP #language models #diverse training data #BERnaT #multilingual AI
5个月前 · ai · - · -

[Paper] 参数高效混合 spiking-quantum 卷积神经网络，使用 surrogate gradient 和 quantum data-reupload

人工智能（AI）和深度学习（DL）的快速发展催生了多个以优化为驱动的子领域，尤其是神经…

#research #paper #ai
5个月前 · ai · - · -

[Paper] 混合时序-8位脉冲编码用于脉冲神经网络代理训练

Spiking neural networks (SNNs) 已经成为计算神经科学和人工智能领域的一个有前景的方向，提供了诸如…的优势。

#research #paper #ai
5个月前 · ai · - · -

[Paper] 通过跨层融合重建 KV 缓存以增强 Transformers

Transformer 解码器在各种任务中取得了强劲的结果，但 KV 缓存所需的内存在长序列长度下变得难以承受。虽然 …

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 基于指南的医学推理在 LLMs 中的训练与评估

机器学习在医学早期预测方面最近表现出突破性性能，然而，过于关注提升预测准确性导致了一个 …

#research #paper #ai #nlp
5个月前 · software · - · -

[Paper] 可运行目录：Monorepo vs. Multi-repo 辩论的解决方案

现代软件系统日益给传统的代码库组织策略带来压力。Monorepos 提供一致性，但往往面临可扩展性问题……

#research #paper #software
5个月前 · devops · - · -

[Paper] 关于 HPC 系统中能效分析的挑战：评估 Synthetic Benchmarks 与 Gromacs

本文讨论了在分析合成基准测试和 Gromacs 软件包在 Fritz 与 Alex HPC 系统上的能效时所遇到的挑战。

#research #paper #devops

Newer posts

Older posts