[Paper] 基于统计的度量阈值设定方法用于固件项目的软件故障预测:工业经验
确保嵌入式固件的软件质量至关重要,尤其是在安全关键领域,需要遵循功能安全标准(ISO 26262)……
4663 posts from this source
确保嵌入式固件的软件质量至关重要,尤其是在安全关键领域,需要遵循功能安全标准(ISO 26262)……
歧义在大型语言模型(LLMs)的自然语言理解中持续带来挑战。为了更好地了解词汇歧义如何被解决……
ISAC 实现了普遍监测,但现代传感算法往往对能量受限的边缘设备来说过于复杂。这促使人们开发 le...
结构偏差(Structural bias,SB)指的是优化算法对搜索空间中特定区域的系统性偏好,这种偏好独立于目标函数而产生。
CI/CD 流水线故障管理在手动执行时非常耗时。自动化此过程并不容易,因为实现有效所需的信息……
不动点迭代构成了静态分析器的算法核心。对不动点引擎进行并行化可以显著缩短分析时间。之前的应用……
我们提出了一个用于在 serverless 平台上动态管理结构化并行处理 skeleton 的框架。我们的目标是实现类似 HPC 的性能和……
随着 AI coding agents 的快速崛起,作为软件工程师的根本前提受到质疑。在本愿景论文中,我们重新审视……
在大规模分布式系统中,移动应用容易受到 backend service 故障的影响,然而传统的 chaos engineering 方法无法大规模…
Moore‑Penrose 伪逆 (PInv) 是线性系统的基本解。在本文中,我们提出了一种对 PInv 的自然推广……
高效且持续地将 large pretrained models 适配到新任务对于 real‑world deployment 至关重要,但由于 catastrophic forgetting 等挑战仍然困难。
多图像空间推理仍然是当前多模态大语言模型(MLLMs)的挑战。虽然单视角感知本质上是二维的,推理……
由提示的大型语言模型构建的多代理系统可以提升多轮推理能力,然而大多数现有的流水线依赖于固定的、跨轨迹的通信……
多模态大型语言模型(MLLMs)通过连接视觉和语言,在多模态感知和推理方面取得了显著进展。然而,大多数现有...
为了完成人类以 natural language 提供的任务,机器人必须解释指令,生成并回答与 scene understanding 相关的问题,……
近期在空间推理方面的进展,使用多模态大语言模型(MLLMs)越来越多地利用来自3D编码器的几何先验。然而,大多数现存……
自回归大型语言模型(LLMs)表现出色,但需要本质上顺序的解码,导致推理延迟高且 GPU 利用率差……
人类很少在显式的全身动作层面上规划与物体的全身交互。高级意图,例如 affordance,定义了目标……
多模态大语言模型(MLLMs)最近被用于通用多模态检索,其中链式思考(CoT)推理能够提升候选项的质量。
预训练的视觉语言模型对物理世界没有良好的直觉。最近的研究表明,监督微调可以提升模型的……
Vision Foundation Models (VFMs) 在应用于各种下游 2D 任务时取得了显著成功。尽管它们效果显著,但它们常常表现出……
Out-of-distribution(OOD)检测,将高维数据映射为标量 OOD 分数,对于机器学习模型的可靠部署至关重要……
基于大型语言模型(LLM)的多代理系统能够实现富表达的代理推理,但其扩展成本高,并且在时间步对齐的场景下校准性较差。
主动推断(AIF)通过最小化期望自由能(EFE)统一了探索与利用,平衡认知价值(信息增益)和实际价值(...)。
近期针对实时长视频生成的研究通常采用 streaming tuning 策略,尝试使用 short‑cont(短上下文)来训练 long‑context student。
记忆在超出单个上下文窗口运行的大型语言模型(LLM)代理中变得日益核心,然而大多数现有系统仍依赖离线的、查询式的…
虚拟现实(VR)已成为评估学校安全措施的强大工具,尤其在学校枪击等高风险情境中,提供实验……
大型语言模型(LLMs)表现出持续的误校准,尤其是在指令微调和偏好对齐之后。修改后的训练目标可以 i...
当 diffusion model 并未记忆 training data set 时,它到底是如何实现 generalize 的?对它生成的 distribution 进行 quantitative understanding …
现有的加速语言模型推理的技术,例如 speculative decoding,需要训练辅助的 speculator 模型并构建和部署…
大型语言模型(LLMs)正日益以零样本方式用于评估心理健康状况,但我们对哪些因素了解有限,...
Thompson 采样(TS)在随机多臂赌博机中被广泛使用,但其在自适应数据收集下的推断属性非常微妙。经典的……
视觉生成模型的快速发展已经超出了传统评估方法的步伐,迫切需要采用 Vision-Language Models 作为替代……
GitHub Security Advisories (GHSA) 已成为开源漏洞披露的核心组成部分,并被开发者和安全工具广泛使用。
基于大型语言模型(LLM)的代理正日益被期望能够自主进行谈判、协调和交易,然而现有的基准缺乏原则性的……
语音情感识别(Speech Emotion Recognition, SER)研究由于缺乏标准且足够大的数据集而受到限制。最近的研究利用了预训练…
扩散大语言模型(dLLMs)已成为文本生成的有前景的替代方案,其特点是原生支持并行解码……
深度研究代理已经成为处理复杂查询的强大系统。与此同时,基于LLM的检索器在fol方面展示了强大的能力。
语义表征可以被构建为一种结构化、动态的知识空间,人类在其中导航以检索和操作意义。为了研究……
广为研究的 DISPERSION 问题是分布式机器人学中的一个基本协作问题,其中一组移动机器人必须重新定位,使得每个占...
长推理模型在多语言环境中常常遇到困难:它们倾向于对非英语问题使用英语进行推理;当被限制在...
多项选择题(MCQs)常用于评估大型语言模型(LLMs)中编码的知识、推理能力,甚至价值观。虽然...
随着大语言模型(LLMs)在复杂推理方面取得突破,基于 Codeforces 的 Elo 评级已成为评估竞争力的突出指标……
DARWIN 是一种进化型 GPT 模型,利用类似遗传算法的优化结构,对多个独立的 GPT 代理进行单独训练……
我们考虑带有 advice 的分布式 wake‑up 问题,其中节点配备了关于整体网络的初始知识。在对手唤醒之后……
代码补全(Code completion,CC)是开发者在与基于 LLM 的编程助手协作时常用的任务。尽管性能有所提升……
本工作研究了自动 AI 代理优化方法在形式验证环境中对真实世界代理的适用性,重点关注自动定理证明……
量子威胁对网络安全的冲击加速了后量子密码学(Post-Quantum Cryptography,PQC)的标准化。将遗留软件迁移到这些量子安全的algo……