[Paper] TableCache:主外键引导的 KV 缓存预计算,实现低延迟 Text-to-SQL
在 Text-to-SQL 任务中,现有的基于 LLM 的方法通常在提示中包含大量数据库模式,导致上下文长度变长并增加预填充延迟。
4750 posts from this source
在 Text-to-SQL 任务中,现有的基于 LLM 的方法通常在提示中包含大量数据库模式,导致上下文长度变长并增加预填充延迟。
归因推理,即预测观察到的行为背后潜在意图的能力,是大型语言模型的一个关键但尚未充分研究的能力……
大型语言模型(LLMs)在对包含数千行数字、多个关联工作表以及嵌入…的企业级大型电子表格进行推理时面临困难。
自动化基础设施即代码(IaC)具有挑战性,且大型语言模型(LLMs)常常从自然语言(NL)生成错误的配置。We p...
Artificial Intelligence (AI) 系统在分类方面取得了良好的成功。然而,缺乏可解释性是一个真实且重大的挑战,尤其是……
我们对 Neural Coverage (NLC) 进行批判性综述,它是 Yuan 等人在 2023 年 ICSE 上提出的最先进的 DNN 覆盖准则。虽然 NLC 提出要满足 eigh…
强化学习(Reinforcement Learning,RL)仍然是机器学习中的核心优化框架。虽然 RL 代理可以收敛到最优解,但对…
虽然量子退火(QA)已被用于组合优化,但实际的 QA 设备在有限温度和噪声下运行,并且它们的...
我们研究在分布式计算集群中计算 matrix chain multiplications 的问题。在此类系统中,性能往往受到 straggle 的限制……
在当今复杂的工业环境中,操作员通常必须浏览大量技术手册,以识别可能的故障排除程序……
神经组合优化(Neural Combinatorial Optimization,NCO)主要关注学习策略,通常是神经网络,这些策略一次只作用于单个候选解……
背景:传统的软件安全分析方法难以跟上现代代码库的规模和复杂性,需要智能自动化……
进化神经网络架构是一个计算量巨大的过程。传统方法通常需要在庞大的架构空间中进行广泛搜索……
自动驾驶辅助系统(ADAS)依赖大量测试以确保安全性和可靠性,但道路场景数据集往往包含冗余案例……
随着大型语言模型(LLMs)在编程领域的发展,智能编程辅导系统受到广泛关注。如何……
Spike-Timing-Dependent Plasticity (STDP) 为脉冲神经网络 (SNN) 提供了一种生物学上有依据的学习规则,但它依赖于精确的脉冲时…
对话代理正日益被用作心理治疗路径中的支持工具,对社会产生重大影响。特别是,同理心是关键…
突触时序依赖可塑性(STDP)为脉冲神经网络(SNN)提供了一种生物学上合理的学习机制;然而,Hebbian 权重更新……
在弹性问题的高阶有限元分析中,matrix-free (PA) 方法是克服传统 Full Assembly 内存瓶颈的关键技术。
在量子软件工程(QSE)中,随着量子软件系统规模和复杂性的增长,量子软件测试(QST)受到越来越多的关注。
Particle-in-Cell (PIC) 模拟在 particle--grid 交互上消耗了大部分执行时间,在这些交互中,细粒度的 atomic updates 成为主要的瓶颈……
通过处理从物联网传感设备收集的数据,在智能家居中进行基于无侵入式传感器的日常活动(Activities of Daily Living,ADLs)识别,支持应用……
设备‑边缘协同推理使用深度神经网络(DNN)在准确率、延迟和能耗之间面临根本性的权衡。目前的调度…
AI 数据中心目前正在大规模部署,以支持对高功耗的大型语言模型(LLMs)的训练和部署。Extensi...
Symmetric linear solves 在广泛的科学和工程应用中是基础性的,从气候建模和结构分析到机器学习……
在资源受限的边缘设备上部署深度神经网络(DNN)常常受到其巨大的计算和内存需求的阻碍。
大型语言模型已成为安全运营中心的变革性工具,能够实现自动化日志分析、网络钓鱼分流和恶意软件解释……
我们展示,任何具有指定时间依赖边缘分布的 stochastic differential equation 都可以分解为三个组成部分:一个唯一的 s...
我们提出 RefVFX,一个新的框架,以前馈方式将复杂的 temporal effects 从 reference video 转移到 target video 或 image 上。虽然 e...
虽然 Transformer 架构在许多领域占据主导地位,但其二次方的 self-attention 复杂度阻碍了其在大规模应用中的使用。Linear attention …
学习如何高效学习是生物体面临的根本挑战,也是人工体日益关注的问题。为了有效学习,代理必须……
基于 deep reinforcement learning 的后训练算法可以在特定目标上突破机器人模型的极限,例如可推广性、精度、……
在人类对话中,双方对话者(interlocutors)都积极参与维持相互理解。当听者(addressees)对说话者(speakers)的意思不确定时,例如……
大型视觉语言模型(LVLMs)已经展示了卓越的能力,但它们在理解和推理多张图像方面的熟练程度仍然……
在敏感领域中对大型语言模型(LLMs)的使用日益增加,导致人们对其置信分数与公平性和偏见之间的对应关系产生了越来越大的兴趣……
遥感变化检测根本上依赖于对双时相特征的有效融合和判别。主流范式通常采用…
大型语言模型(LLMs)正日益被用作学习的对话伙伴,然而支持用户学习和参与的互动动态……
欧洲航天局(ESA),受其在计划中的月球任务以及 Argonaut lander 的雄心驱动,对可靠的 crater detection 有着深厚的兴趣。
大型语言模型(LLMs)越来越多地被评估其执行多跳推理的能力,即将多个信息片段组合成……
系统日志对于监控和诊断现代计算基础设施至关重要,但它们的规模和复杂性需要可靠且高效的自动化……
随着大型语言模型(LLMs),如 ChatGPT、Copilot、Claude 和 Gemini,逐渐融入软件开发工作流,开发者越来越…
LLM agents 在庞大且动态的 tool libraries 上运行,依赖有效的检索,然而标准的 single-shot dense retrievers 在处理复杂请求时表现乏力……
虽然Chain-of-Thought(CoT)提示提升了LLM的推理能力,但在一致性、准确性和自我纠正方面仍然存在挑战,尤其是针对复杂或伦理…
虽然 Vision-Language Models(VLMs)显著推动了 Computer-Using Agents(CUAs)的发展,但当前框架在长时程工作流的鲁棒性方面仍然存在困难……
我们介绍 DT-ICU,这是一种用于重症监护中连续风险估计的多模态 digital twin 框架。DT-ICU 集成了可变长度的临床时间序列……
最近的工作如 REPA 已经表明,使用外部语义特征(例如 DINO)来引导 diffusion models 可以显著加速其训练。
大型语言模型(LLMs)能够产生出令人惊讶的相当复杂的自身不确定性估计。然而,仍然不清楚这种表达的程度……
理解叙事需要识别哪些事件对故事进展最为突出。我们提出了一种对比学习框架用于建模……