[Paper] CLAD:高效日志异常检测直接在压缩表示上
系统日志的爆炸性增长使得流式压缩变得必不可少,然而现有的日志异常检测(LAD)方法会产生严重的预处理开销……
系统日志的爆炸性增长使得流式压缩变得必不可少,然而现有的日志异常检测(LAD)方法会产生严重的预处理开销……
Energy Conserving Descent (ECD) 算法最近由 De Luca 与 Silverstein(2022)提出,作为一种全局非凸优化方法。不同于梯度……
Computed tomography (CT) enterography 是评估炎症性肠病 (IBD) 的主要成像方式,但最佳的表征选择仍有待确定。
计算机使用代理(Computer Use Agents,CUAs)根本上依赖图形用户界面(graphical user interface,GUI)基础,将语言指令转换为可执行的屏幕操作,但……
自主 AI 研究发展迅速,但长期视野的 ML 研究工程仍然困难:代理必须在任务理解上保持连贯的进展……
AI驱动的教育平台在个性化方面取得了一定进展,但大多数仍受限于静态适应——预定义的测验、统一的进度、……
On-policy distillation (OPD) 已成为大语言模型后训练的核心技术,但其训练动态仍然了解不足。这……
On-policy distillation (OPD) 已经成为大语言模型的一种高效的后训练范式。然而,标准的 OPD 需要实时的教师推理……
Instruction-tuned 大型语言模型产生有帮助、结构化的响应,但当受到微不足道的约束时,这种帮助性有多稳健?我们展示了简…
大型语言模型(LLMs)在驱动各种软件工程(SE)工具方面展现了巨大的潜力。提供自然语言作为一种直观的交互……
大型语言模型(LLMs)正日益被整合到现实世界的决策中,包括公共政策领域。然而,它们的能力去理解…
逻辑漏洞在软件中源于 program logic 的缺陷,而不是 memory safety,这可能导致关键的 security failures。虽然现有的 …
预测 longitudinal data 中的 counterfactual outcomes,尤其是当 sequential treatment decisions 严重依赖于不断演变的 patient states 时,既关键又极具挑战性。
执行准确率(EX),一种广泛用于评估自然语言转SQL(NL2SQL)解决方案有效性的指标,正变得越来越不可靠……
自主 AI 代理正迅速从实验工具转变为运营基础设施,预计 80% 的企业应用将……
光学字符识别(OCR)随着视觉语言模型的兴起而迅速发展,但评估仍然集中在少数几个……
多模态联邦学习实现了在医疗机构之间进行隐私保护的协作模型训练。然而,一个根本性的挑战出现了……
在 deep learning 优化中,平衡收敛速度、泛化能力和计算效率仍然是一个核心挑战。First-order gradient…
在深度学习中被引用最多的校准结果——在 CIFAR-100 上的 post-temperature-scaling ECE 为 0.012(Guo et al., 2017)——低于统计噪声的...
传统的固定深度架构通过增加训练 FLOPs 来提升质量,通常通过增加参数化(parameterization),但代价是更高的内存……
Speech-to-speech language models 最近出现,以提升对话式 AI 的自然度。特别是,full-duplex models 通过 t...
Metonymy 和 metaphor 常常在自然语言中共现,但计算工作大多是孤立地研究它们。我们提出了一个将……转化的框架。
二进制反编译是一项关键的逆向工程任务,旨在从已剥离的可执行文件中重建高级源代码。虽然 Large Language Model...
多语言基准指导前沿模型的开发。然而,前沿模型报告的多语言评估结构类似于流行的...
许多程序合成、超优化和数组编程技术需要对通用程序进行并行展开。GPU,虽然能够…
代码推理任务在评估大型语言模型(LLMs)方面变得日益关键。然而,大多数现有基准测试依赖于简化的、由LLM生成的代码片段……
在关于神经元细胞自动机(NCAs)的文献中,通常理所当然地认为这些系统会学习吸引子。这一点通过演化 th...
本文介绍了 EPAC,这是一款基于 RISC-V 的加速器芯片,作为欧洲处理器计划(EPI)多年度、多合作伙伴努力的一部分而开发。
大型企业通常在大型、异构的计算集群上运行广泛的持续集成(CI)流水线,在这些环境中,保守的、静态定义的……
在计算连续体上部署应用程序需要从地理分布且异构的环境中选择基础设施节点,……
公平性是与人类相关的高风险软件系统的关键需求,推动了对偏差缓解的大量研究。先前的工作主要关注...
大规模的基础模型(Foundational Models,FM)预训练构成了一个计算密集型的第一阶段,以实现人工智能在多样的科学和社会领域的应用……
联邦学习(FL)为在边缘协同微调大型语言模型(LLMs)提供了一条有前景的路径;然而,这一范式面临着…
大型语言模型(LLMs)越来越依赖显式推理来解决编码任务,但评估此类推理的质量仍然具有挑战性。Ex...
流式数据驱动优化(SDDO)问题在许多应用中出现,这些应用中数据持续到达,且优化环境随时间演变……
vibe coding 的出现,这是一种范式,非技术用户通过自然语言指示大型语言模型(LLMs)生成可执行代码,预…
我们系统性地测量了七种策略,以在小型本地模型可以作为前置分流层的情况下,减少云端 LLM 的 token 使用量。
大型语言模型(LLMs)可以根据自然语言生成代码,但它们在多大程度上捕捉到预期的程序行为仍不清楚。Executable...
我们研究在网络上进行去中心化学习的情形,其中数据分布在各节点上,没有中心协调者。Random walk learning 是一种基于 token 的方法……
深度神经网络尽管具有很高的准确率,但往往表现出置信度校准不足,限制了它们在高风险应用中的可靠性。当前的…
我们提出 (Experience‑Modulated Biologically‑inspired Emergent Reasoning),一种混合认知架构,重新组织大型语言模型之间的关系……
现代机器学习方法已被提出用于检测外星样本中的生命,利用其区分生物性与非生物性样本的能力。
在3D计算机视觉中,寻找图像之间的匹配关键点是一个核心问题。然而,现代匹配器在处理大幅平面旋转时表现不佳。A straightfo...
自主离网光伏系统的稳定运行要求依赖遵循大气热力学的太阳能预测算法。Cont...
在本工作中,我们研究了人-物交互视频生成(Human-Object Interaction Video Generation,HOIVG),其目标是基于 t 合成高质量的人-物交互视频。
利用诸如大五人格等心理构念,大语言模型(LLMs)可以模仿特定的个性特征并预测用户的个性。Wh...
我们提出了 SyncFix,一个在基于扩散的重建场景细化过程中强制跨视图一致性的框架。SyncFix 将细化……
Tool-augmented Large Language Model (LLM) agents 已经展示了在自动化复杂、多步骤真实世界任务方面的惊人能力,但仍然存在脆弱性……