research — Page 52

排序:

3周前 · ai · - · -

[Paper] 权重衰减提升语言模型可塑性

在大型语言模型（LLM）开发中，主流范式是先对基础模型进行预训练，然后进行进一步的训练以提升性能和模型……

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] 恰逢其时：Token-Level Early Stopping for Diffusion Language Models

扩散语言模型通过迭代细化生成文本，这一过程通常计算效率低下，因为许多标记在达到稳定状态后……

#research #paper #ai #machine-learning #nlp
3周前 · devops · - · -

[Paper] Min‑Sum 均匀覆盖问题（自主移动机器人）

我们研究在给定的有限线段以及具有有限正半径的圆上，对 n 台移动机器人群的 min-sum uniform coverage problem，其中……

#research #paper #devops
3周前 · ai · - · -

[论文] PhyCritic：用于物理 AI 的多模态批评模型

随着大型多模态模型的快速发展，可靠的judge和critic模型已成为开放式评估和preference alignment的关键。

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 学习组合用于跨领域 Agentic 工作流生成

自动生成 agentic 工作流——可执行的 operator 图或代码，用于编排推理、验证和修复——已成为一种实用的……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] TEGRA：文本编码与图和检索增强用于误信息检测

误信息检测是一项关键任务，能够显著受益于外部知识的整合，就像人工事实核查一样。在本...

#research #paper #ai #nlp
3周前 · ai · - · -

[论文] FastFlow：通过Bandit推断加速生成流匹配模型

Flow-matching 模型在图像和视频生成方面提供了最先进的保真度，但其固有的顺序去噪过程使其速度较慢。Existin...

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 推理模型的安全恢复仅需几步早期引导

基于强化学习（RL）的后训练用于显式链式思考（例如 GRPO）提升了多模态大规模推理模型的推理能力。

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] 首届国际 StepUP 脚步生物特征识别竞赛：方法、结果与剩余挑战

Biometric footstep recognition，基于人们在行走时脚下独特的压力模式，是一个新兴领域，应用正日益增长……

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] SteuerLLM：本地专用大型语言模型用于德国税法分析

大型语言模型（LLMs）展示了强大的通用推理和语言理解能力，但在受严格形式约束的领域中，它们的性能会下降。

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] PuriLight：一种轻量级 Shuffle 与 Purification 框架用于单目深度估计

我们提出了 PuriLight，一个轻量且高效的框架，用于自监督单目深度估计，以应对计算效率方面的双重挑战……

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 交互式 LLM 辅助的课程学习用于多任务进化策略搜索

多任务策略搜索是一个具有挑战性的问题，因为策略需要在训练案例之外进行泛化。课程学习已被证明是有效的……

#research #paper #ai #machine-learning

Newer posts

Older posts