[Paper] TaxonRL:强化学习与中间奖励用于可解释的细粒度视觉推理
传统的 vision-language models 在对比细粒度分类推理方面表现不佳,尤其是在区分外观相似的物种时……
传统的 vision-language models 在对比细粒度分类推理方面表现不佳,尤其是在区分外观相似的物种时……
构建计算机辅助设计(CAD)模型工作量大,但对工程和制造至关重要。近期在大型语言模型(LL...)取得了重要进展。
近期的研究将从大型语言模型(LLM)隐藏状态中线性可恢复的地理和时间变量解释为对类世界 i… 的证据。
Test-time scaling 对复杂推理任务显示,利用 inference-time compute,通过诸如独立采样和聚合多个样本的方法,……
大型语言模型(LLMs)经常表现出高度迎合和强化的对话风格,也被称为 AI‑sycophancy。虽然这种行为受到…
随着大型语言模型(LLMs)从研究原型转向真实世界系统,定制化已成为一个核心瓶颈。虽然文本提示…
我们提出了VietNormalizer1,一个开源、零依赖的 Python 库,用于越南语文本规范化,面向 Text-to-Speech (TTS) 和自然语言处理……
Large language model (LLM)-powered agents 已经展示出在自动化软件工程任务(如 static bug fixing)方面的强大能力,如证据所示……
生成式人工智能(AI)提供了可扩展的形成性反馈支持,但大多数 AI 生成的反馈依赖于任务特定的评分标准……
Contrastive steering 已被证明是一种简单且有效的方法,可在 inference time 调整 LLMs 的生成行为。它使用 prompt 示例……
Agentic language models 在安全机制上与 chat models 完全不同:它们必须进行计划、调用工具,并执行 long-horizon actions …
CDD(Contamination Detection via output Distribution),通过测量模型采样输出的峰度来识别数据污染。我们研究了……