Source

arXiv

4750 posts from this source

排序:

3个月前 · ai · - · -

[Paper] TableCache：主外键引导的 KV 缓存预计算，实现低延迟 Text-to-SQL

在 Text-to-SQL 任务中，现有的基于 LLM 的方法通常在提示中包含大量数据库模式，导致上下文长度变长并增加预填充延迟。

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 推断潜在意图：归因自然语言推理在 LLM 代理中的应用

归因推理，即预测观察到的行为背后潜在意图的能力，是大型语言模型的一个关键但尚未充分研究的能力……

#research #paper #ai #nlp
3个月前 · ai · - · -

从行到推理：用于电子表格理解的检索增强多模态框架

大型语言模型（LLMs）在对包含数千行数字、多个关联工作表以及嵌入…的企业级大型电子表格进行推理时面临困难。

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] TerraFormer：使用 LLMs 通过策略引导的验证器反馈进行微调的自动化基础设施即代码

自动化基础设施即代码（IaC）具有挑战性，且大型语言模型（LLMs）常常从自然语言（NL）生成错误的配置。We p...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 一种在决策中使用量化活性成分的可解释AI新方法

Artificial Intelligence (AI) 系统在分类方面取得了良好的成功。然而，缺乏可解释性是一个真实且重大的挑战，尤其是……

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] 重审‘Revisiting Neuron Coverage for DNN Testing: A Layer-Wise and Distribution-Aware Criterion’: 批判性综述及对 DNN 覆盖率测试的影响

我们对 Neural Coverage (NLC) 进行批判性综述，它是 Yuan 等人在 2023 年 ICSE 上提出的最先进的 DNN 覆盖准则。虽然 NLC 提出要满足 eigh…

#research #paper #software
3个月前 · ai · - · -

[论文] 非遍历情境中的深度强化学习模型无关解决方案

强化学习（Reinforcement Learning，RL）仍然是机器学习中的核心优化框架。虽然 RL 代理可以收敛到最优解，但对…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 通过基于量子退火的谱采样进行回归的核学习

虽然量子退火（QA）已被用于组合优化，但实际的 QA 设备在有限温度和噪声下运行，并且它们的...

#research #paper #ai #machine-learning
3个月前 · devops · - · -

[Paper] 多变量多项式码用于分布式系统中高效的矩阵链乘法

我们研究在分布式计算集群中计算 matrix chain multiplications 的问题。在此类系统中，性能往往受到 straggle 的限制……

#research #paper #devops
3个月前 · software · - · -

[Paper] ‘Where is My Troubleshooting Procedure?’：研究RAG在协助大型Cyber-Physical System故障解决中的潜力

在当今复杂的工业环境中，操作员通常必须浏览大量技术手册，以识别可能的故障排除程序……

#research #paper #software
3个月前 · ai · - · -

[Paper] 为神经组合优化实现基于种群的架构

神经组合优化（Neural Combinatorial Optimization，NCO）主要关注学习策略，通常是神经网络，这些策略一次只作用于单个候选解……

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] LLMs 在代码漏洞分析中的概念验证

背景：传统的软件安全分析方法难以跟上现代代码库的规模和复杂性，需要智能自动化……

#research #paper #software
3个月前 · ai · - · -

[Paper] NEVO-GSPT：基于种群的神经网络进化使用 Inflate 和 Deflate 操作符

进化神经网络架构是一个计算量巨大的过程。传统方法通常需要在庞大的架构空间中进行广泛搜索……

#research #paper #ai
3个月前 · software · - · -

[Paper] 基于覆盖的道路选择与优先级排序用于自动驾驶系统的高效测试

自动驾驶辅助系统（ADAS）依赖大量测试以确保安全性和可靠性，但道路场景数据集往往包含冗余案例……

#research #paper #software
3个月前 · ai · - · -

[Paper] 面向学习者的 Program Repair：一种基于迭代编辑驱动检索增强的 Solution Generator

随着大型语言模型（LLMs）在编程领域的发展，智能编程辅导系统受到广泛关注。如何……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[论文] 监督式脉冲一致性依赖可塑性用于脉冲神经网络的快速局部学习

Spike-Timing-Dependent Plasticity (STDP) 为脉冲神经网络 (SNN) 提供了一种生物学上有依据的学习规则，但它依赖于精确的脉冲时…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 你能理解我的感受吗？：迈向 Therapy Chatbots 中的可验证共情

对话代理正日益被用作心理治疗路径中的支持工具，对社会产生重大影响。特别是，同理心是关键…

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] 基于睡眠的稳态正则化用于稳定循环脉冲神经网络中的 Spike-Timing-Dependent Plasticity

突触时序依赖可塑性（STDP）为脉冲神经网络（SNN）提供了一种生物学上合理的学习机制；然而，Hebbian 权重更新……

#research #paper #ai
3个月前 · devops · - · -

[Paper] 转移最佳区间：高性能无矩阵方法用于高阶弹性

在弹性问题的高阶有限元分析中，matrix-free (PA) 方法是克服传统 Full Assembly 内存瓶颈的关键技术。

#research #paper #devops
3个月前 · software · - · -

[Paper] 量子软件测试中实证研究的方法论分析

在量子软件工程（QSE）中，随着量子软件系统规模和复杂性的增长，量子软件测试（QST）受到越来越多的关注。

#research #paper #software
3个月前 · devops · - · -

[Paper] Matrix-PIC：利用矩阵外积实现高性能粒子-网格模拟

Particle-in-Cell (PIC) 模拟在 particle--grid 交互上消耗了大部分执行时间，在这些交互中，细粒度的 atomic updates 成为主要的瓶颈……

#research #paper #devops
3个月前 · ai · - · -

[Paper] 通过基于事件的上下文和置信度提升大语言模型在零样本 ADL 识别中的表现

通过处理从物联网传感设备收集的数据，在智能家居中进行基于无侵入式传感器的日常活动（Activities of Daily Living，ADLs）识别，支持应用……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 层次化在线调度用于节能 Split Inference 的渐进式传输

设备‑边缘协同推理使用深度神经网络（DNN）在准确率、延迟和能耗之间面临根本性的权衡。目前的调度…

#research #paper #ai #machine-learning
3个月前 · devops · - · -

[Paper] AI 数据中心的协同冷却与计算管理

AI 数据中心目前正在大规模部署，以支持对高功耗的大型语言模型（LLMs）的训练和部署。Extensi...

#research #paper #devops
3个月前 · devops · - · -

[Paper] 层次精度与递归用于加速 MXU 上的对称线性求解

Symmetric linear solves 在广泛的科学和工程应用中是基础性的，从气候建模和结构分析到机器学习……

#research #paper #devops
3个月前 · devops · - · -

[Paper] 在哪里划分？针对边缘推理的 DNN 分割的帕累托前沿分析

在资源受限的边缘设备上部署深度神经网络（DNN）常常受到其巨大的计算和内存需求的阻碍。

#research #paper #devops
3个月前 · ai · - · -

[论文] SecureCAI：面向网络安全运营的抗注入LLM助手

大型语言模型已成为安全运营中心的变革性工具，能够实现自动化日志分析、网络钓鱼分流和恶意软件解释……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 随机微分方程的完整分解

我们展示，任何具有指定时间依赖边缘分布的 stochastic differential equation 都可以分解为三个组成部分：一个唯一的 s...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 免调参视觉效果跨视频转移

我们提出 RefVFX，一个新的框架，以前馈方式将复杂的 temporal effects 从 reference video 转移到 target video 或 image 上。虽然 e...

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[论文] MHLA：通过 Token 级多头恢复线性注意力的表达能力

虽然 Transformer 架构在许多领域占据主导地位，但其二次方的 self-attention 复杂度阻碍了其在大规模应用中的使用。Linear attention …

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 平衡投入与性能的最佳学习率调度

学习如何高效学习是生物体面临的根本挑战，也是人工体日益关注的问题。为了有效学习，代理必须……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] Failure-Aware RL：可靠的离线到在线强化学习与自我恢复用于真实世界操作

基于 deep reinforcement learning 的后训练算法可以在特定目标上突破机器人模型的极限，例如可推广性、精度、……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] Reference Games 作为模型不确定性与澄清请求对齐的测试平台

在人类对话中，双方对话者（interlocutors）都积极参与维持相互理解。当听者（addressees）对说话者（speakers）的意思不确定时，例如……

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] 更多图像，更多问题？对 VLM 失效模式的受控分析

大型视觉语言模型（LVLMs）已经展示了卓越的能力，但它们在理解和推理多张图像方面的熟练程度仍然……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 自信陷阱：性别偏见与预测确定性在 LLMs 中

在敏感领域中对大型语言模型（LLMs）的使用日益增加，导致人们对其置信分数与公平性和偏见之间的对应关系产生了越来越大的兴趣……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] Exchange 是遥感变化检测所需的一切

遥感变化检测根本上依赖于对双时相特征的有效融合和判别。主流范式通常采用…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 通过对话学习：剖析人类与LLM在政治议题上的对话动态

大型语言模型（LLMs）正日益被用作学习的对话伙伴，然而支持用户学习和参与的互动动态……

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] 视觉语言模型用于精确陨石坑检测

欧洲航天局（ESA），受其在计划中的月球任务以及 Argonaut lander 的雄心驱动，对可靠的 crater detection 有着深厚的兴趣。

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 亲属关系数据基准用于多跳推理

大型语言模型（LLMs）越来越多地被评估其执行多跳推理的能力，即将多个信息片段组合成……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 小型语言模型与小型推理语言模型在系统日志严重性分类上的基准评估

系统日志对于监控和诊断现代计算基础设施至关重要，但它们的规模和复杂性需要可靠且高效的自动化……

#research #paper #ai #machine-learning
3个月前 · software · - · -

[论文] “TODO: Fix the Mess Gemini Created”：走向理解 GenAI 引发的自认技术债务

随着大型语言模型（LLMs），如 ChatGPT、Copilot、Claude 和 Gemini，逐渐融入软件开发工作流，开发者越来越…

#research #paper #software
3个月前 · ai · - · -

[Paper] 超越单次：通过查询规划的多步工具检索

LLM agents 在庞大且动态的 tool libraries 上运行，依赖有效的检索，然而标准的 single-shot dense retrievers 在处理复杂请求时表现乏力……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 通过多视角反思提升大型语言模型的自我纠正

虽然Chain-of-Thought（CoT）提示提升了LLM的推理能力，但在一致性、准确性和自我纠正方面仍然存在挑战，尤其是针对复杂或伦理…

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] OS-Symphony：用于稳健且通用的计算机使用代理的整体框架

虽然 Vision-Language Models（VLMs）显著推动了 Computer-Using Agents（CUAs）的发展，但当前框架在长时程工作流的鲁棒性方面仍然存在困难……

#research #paper #ai #machine-learning #nlp #computer-vision
3个月前 · ai · - · -

[论文] DT-ICU：面向可解释的 ICU 病人监测的数字孪生，通过多模态和多任务迭代推理

我们介绍 DT-ICU，这是一种用于重症监护中连续风险估计的多模态 digital twin 框架。DT-ICU 集成了可变长度的临床时间序列……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 超越外部指导：释放扩散Transformer内部的语义丰富性以提升训练

最近的工作如 REPA 已经表明，使用外部语义特征（例如 DINO）来引导 diffusion models 可以显著加速其训练。

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] LLM 决策是否忠实于口头自信？

大型语言模型（LLMs）能够产生出令人惊讶的相当复杂的自身不确定性估计。然而，仍然不清楚这种表达的程度……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 对比学习与Narrative Twins用于建模故事显著性

理解叙事需要识别哪些事件对故事进展最为突出。我们提出了一种对比学习框架用于建模……

#research #paper #ai #nlp

Newer posts

Older posts