AI — Page 28 | EUNO.NEWS

排序:

2周前 · ai · - · -

[Paper] 稳定异步：方差控制的离策略强化学习用于LLMs

强化学习（RL）被广泛用于提升大型语言模型在推理任务上的表现，而异步RL训练具有吸引力，因为它能够提升……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 面向随时有效的统计水印

大型语言模型（LLMs）的激增需要有效的机制来区分机器生成的内容和人类文本。虽然统计……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[论文] 级联等价假设：何时语音 LLM 的行为类似于 ASR→LLM 管道？

当前的语音大语言模型在很大程度上执行隐式 ASR：在可以通过转录本解决的任务上，它们在行为上和机制上等同于简单的 WhispertoL……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] 在 Web Agents 中建模不同的人类交互

尽管自主网页代理取得了快速进展，但在人类参与仍然是必不可少的，以在任务展开时塑造偏好并纠正代理行为。Howe...

#research #paper #ai #nlp
2周前 · it · - · -

Ring 可能计划将 Search Party 功能扩展到狗之外

背景：Ring 的有争议的 Search Party 功能最初是为了帮助寻找走失的狗而推出的。最近 404 Media 获得的电子邮件表明，该公司……

#Ring #Search Party #surveillance #privacy #AI #smart home security #neighborhood safety
2周前 · ai · - · -

[Paper] RetouchIQ：MLLM Agents用于基于指令的图像修饰的通用奖励

近期在多模态大型语言模型（MLLMs）方面的进展显示出将视觉语言推理扩展到专业工具化图像的巨大潜力……

#research #paper #ai #computer-vision
2周前 · ai · - · -

[Paper] KLong：训练 LLM 代理用于极长时程任务

本文介绍了 KLong，这是一款开源的 LLM 代理，经过训练以解决极长时域任务。其原理是首先通过冷启动模型，利用轨迹……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] 学会保持安全：在微调过程中针对安全退化的自适应正则化

Instruction-following language models 被训练为有帮助且安全，但它们的安全行为在良性微调下可能会恶化，并且在 ad...

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

调查显示电信领域的AI进展：网络和自动化占据主导，投资回报率攀升

AI 正在加速电信行业的转型，成为自主网络和 AI 原生无线基础设施的支柱。在...

#ai #gpu #nvidia
2周前 · ai · - · -

关于游戏的一切：使用 GeForce NOW 畅玩超过4500款游戏

GeForce NOW 6 年周年庆 GeForce NOW 的周年庆活动仍在进行中，本周的主题是让它成为可能的游戏。W...

#ai #gpu #nvidia
2周前 · it · - · -

‘last-mile’ 数据问题正在拖慢企业 agentic AI —— ‘golden pipelines’ 旨在解决它

传统 ETL 与 AI‑驱动的数据准备传统 ETL 工具如 dbt 或 Fivetran 为报告准备数据：结构化分析和 dashboards。

#it #startups #ai
2周前 · ai · - · -

[Paper] 大语言模型在长上下文代码问答中的鲁棒性与推理保真度

大型语言模型（LLMs）日益在需要对长代码上下文进行推理的软件工程任务中提供帮助，但它们在不同…的鲁棒性仍然是一个问题。

#research #paper #ai #machine-learning

Newer posts

Older posts