【论文】KORAL:知识图谱引导的 LLM 推理用于 SSD 运营分析
固态硬盘(SSD)对数据中心、消费平台和关键任务系统至关重要。然而,诊断它们的性能和可靠性却非常困难……
3122 posts from this source
固态硬盘(SSD)对数据中心、消费平台和关键任务系统至关重要。然而,诊断它们的性能和可靠性却非常困难……
近期在 LLM 引导的进化计算,特别是 AlphaEvolve 方面的进展,已经展示了在发现新颖数学构造方面的显著成功……
大型语言模型(LLMs)经常提供看似合理的链式思考(CoT)推理轨迹,但可能隐藏内部偏见。我们将这些称为 *unverbalized* …
现实世界中为具身代理收集数据仍然成本高且不安全,这需要可扩展、逼真且可直接用于模拟器的 3D 环境。然而,现有的……
Multiple rotation averaging (MRA) 是 3D 视觉和机器人领域的一个基础优化问题,旨在恢复全局一致的绝对旋转 fr...
扩展 action‑controllable world models 受限于动作标签的稀缺。虽然 latent action learning 有望从 u… 提取 control interfaces。
从未标记的视频数据中学习可迁移的知识并将其应用于新环境,是智能体的一项基本能力。该工作预…
数据隐私和可解释人工智能(XAI)是现代机器学习系统的两个重要方面。为了增强数据隐私,最近的机器…
利用表示编码器进行生成建模提供了一条实现高效、高保真合成的路径。然而,标准的 diffusion transformers 未能…
在互联网规模的视频上进行视觉-语言-动作(VLA)策略的预训练很有吸引力,但当前的潜在动作目标往往学习错误的东西:它们……
我们研究单个训练样本如何塑造循环变换器的内部计算,其中共享块被应用于 τ 次递归迭代到 e...
语言模型已成为量子计算教育和研究的实用工具,从摘要技术论文到解释理论概念等。
我们介绍了 Forensim,这是一种基于注意力的状态空间框架,用于图像伪造检测,可同时定位被篡改(目标)区域和源区域……
Out-of-distribution (OOD) 检测对于机器学习系统的安全部署至关重要。现有的后置检测器通常依赖于模型置信度……
大型语言模型(LLMs)经常生成不必要冗长的Chain-of-Thought(CoT)推理,这会增加计算成本和延迟,却没有相应的收益……
Artifact evaluation 已成为软件工程社区的标准实践,以确保研究结果的可重复性。然而,当前的 m...
高效探索仍然是强化学习(RL)的核心挑战,尤其是在稀疏奖励环境中。我们引入 Optimistic World Mode……
RAG TREC Instrument for Multilingual Evaluation (RAGTIME) 赛道在 TREC 的主要目标是研究从多语言源文档生成报告……
验证主张的真实性通常需要对文本和视觉证据进行联合多模态推理,例如分析文本标题……
大型语言模型(LLMs)正日益用于在高风险、特定领域的环境中支持问答和决策,例如 natural ha...
越南语采用音位正字法,每个 grapheme 最多对应一个 phoneme,反之亦然。利用这种高度的 grapheme‑phoneme 透明性……
儿童如何在有限的输入下获得母语水平的句法?根据刺激贫乏假设(PoSH),儿童接收到的语言输入……
现代软件系统不断进行代码升级,以提升功能、安全性和性能,而大型语言模型(LLMs)已经展示……
随着量子算法和硬件的不断发展,确保量子软件栈(QSS)的正确性变得日益重要。然而,...