[Paper] 在软件工程中使用 Lean Research Inception 教授实用相关的研究问题制定
[背景] 精心制定的软件工程(SE)研究问题对于弥合产业与学术之间的差距至关重要。Lean Research Inception(……)
4650 posts from this source
[背景] 精心制定的软件工程(SE)研究问题对于弥合产业与学术之间的差距至关重要。Lean Research Inception(……)
配置调优对于提升性能在质量保证中至关重要。然而,由于黑箱性质,调优器的有效性长期以来一直是个谜。
程序理解是软件工程中的一项基本活动。它不仅经常给专业人士带来挑战,还可能阻碍新手的进步。
Serverless computing 抽象了基础设施管理,但也掩盖了可能导致安全风险的系统级行为。先前的工作已经表明,s...
大型语言模型(LLMs)和代理系统在自动化软件开发方面展现出前景,但将它们应用于硬件在环(HIL)嵌入式……
本文提出了一种流程,用于协调利益相关者在考虑 performance indicators 与相应 interface requirements 以实现 automated 时的工作。
全局多数问题,常被称为密度分类任务,是在探究计算能力背景下的经典基准。
分布式科学工作流越来越多地跨越 heterogeneous compute clusters、edge resources 和 geo-distributed data repositories。在这些环境中,...
云机器人使机器人能够将高维运动规划和推理卸载到远程服务器上。然而,对于需要连续操作的任务……
1976年7月,Metcalfe 和 Boggs 在《Communications of the ACM》上发表了他们关于 Ethernet 的奠基性论文。他们的效率模型——E = (P/C)/(P/C + W*T)——...
调试在软件开发生命周期中占据了相当大的比重,然而大型语言模型(LLMs)在这项任务中的有效性尚未得到充分了解。
Token pruning 对提升视觉语言模型(VLMs)的计算效率至关重要,尤其是在时间冗余显著的基于视频的任务中。
多模态大语言模型(MLLMs)展现出强大的视觉-语言推理能力,但仍局限于其原生模态,无法直接处理 st...
多模态大语言模型(MLLMs)在连接视觉和语言方面取得了令人印象深刻的进展,但它们仍然在空间理解方面存在困难……
在本工作中,我们提出了 EchoGen,一个用于 layout-to-image generation 和 image grounding 的统一框架,能够生成具有精确布局的图像和……
我们提出了一种 training-free 框架,用于在 test time 对 text‑conditioned generative models 进行连续且可控的图像编辑。与之前的...
Tokenization 是在各种模态的生成建模中的基础技术。尤其是,它在自回归(AR)模型中发挥关键作用,……
在3D环境中合成可控的6-DOF对象操作轨迹对于使机器人能够与复杂场景交互至关重要,但仍然……
Controlled video generation 在近几年取得了显著的进步。然而,编辑操作和动态事件,或插入应产生影响的内容……
近期的多模态大型语言模型(MLLMs)在三维场景中的空间推理方面表现出很高的潜力。然而,它们通常依赖于计算上……
软件漏洞的数量持续增长,且在实际中仍然难以检测。尽管基于学习的漏洞检测已有进展,……
机器人基础模型已经展示了在各种任务和环境中执行自然语言指令的强大能力。然而,它们……
虽然 Large Language Models 在广泛的 NLP 任务中取得了 state-of-the-art 的成果,但它们仍然容易受到系统性偏见的影响。其中,性别偏见 …
将语言模型扩展到视频会带来两个挑战:表示方面,现有方法依赖于有损近似;以及长上下文方面,其中 capti...
在复杂控制系统中的快速适应仍然是强化学习的核心挑战。我们提出了一个框架,其中策略和价值函数 …
在多语言预训练中,预训练模型的测试损失受到预训练数据中每种语言比例的强烈影响,即语言的…
大型语言模型(LLMs)尽管仅在下一个标记生成任务上进行训练,却展现出潜在的多标记预测(MTP)能力。我们提出一个简…
我们考虑一种基于投注的顺序检验的变体,其中在每个时间步,统计学家会被呈现多个数据源(arms),并获取数据……
大型语言模型(LLMs)包含数十亿参数,但许多精确数值并非关键。我们展示,最关键的是权重的相对排名……
随着大语言模型(LLMs)在多语言环境中的部署,它们在文化多样的低资源语言中的安全行为仍然缺乏了解。
理解人类语言之间的距离是语言学、人类学以及追溯人类进化史的核心。然而,尽管语言学已经…
Runtime verification 已获得广泛关注,作为一种轻量级方法,用于提升受审系统的可靠性。执行 runtime checks 能够动态…
大型语言模型(LLMs)和 AI 代理正日益被集成到企业系统中,以访问内部数据库并生成上下文感知的响应……
科学 Python 代码中的方法论错误会产生看似合理但实际上错误的结果,而传统的 linters 和 static analysis tools 无法检测到。Several res...
Post training quantization 对于在资源受限的硬件上部署 large language models (LLMs) 至关重要,然而最先进的方法强制统一…
大型语言模型(LLMs)已经实现了前所未有的流畅度,但仍然容易出现“幻觉”——即生成事实不正确或缺乏依据的内容……
对编码代理在大型代码库上执行任务的前提条件是代码定位——识别相关的文件、类和函数以 w...
多模态自动程序修复(MAPR)通过要求模型对源代码、文本问题描述等进行联合推理,扩展了传统的程序修复。
Contextual embeddings 由 LLMs 生成,表现出强烈的 positional inductive biases,这可能限制它们充分捕获 long‑range、order‑sensitive 的信息。
大型语言模型(LLMs)的出现标志着信息系统工程理论基础的转折点。超越其技术……
满足严格的 Time-To-First-Token (TTFT) 要求对 LLM 应用至关重要。为了提升效率,现代 LLM 服务系统采用了 disaggregated……
本文介绍并论证了神经语言整合(Neuro-Linguistic Integration,NLI)的概念,这是一种用于人机交互的新范式,其中 Large Langu...
Lossless model compression 在缓解位精确 Large Language Model (LLM) 服务中的内存和带宽瓶颈方面具有巨大的潜力。然而……
一个编码代理可以自举自身。它从一份926字的规范和由现有代理(Claude Code)产生的首次实现开始,一个新生成的……
机器学习(Machine Learning,ML)云服务,由亚马逊、谷歌和微软等领先提供商提供,使得将 ML 组件集成到软件中成为可能……
GPU 推理集群每瓦特能交付多少 token?在相同硬件的不同部署中,这个答案相差 40 倍——并不是因为软件效率…
攻击可以利用未公开的零日或一天漏洞。为了检测这些漏洞,安全研究人员监控开发...
形式规范,例如 pre- and post-conditions,为进行彻底的程序验证提供了坚实的基础。然而,开发者很少提供 s...