research paper

1周前 · ai

从 production language models 中提取书籍 (2026)

请提供您希望翻译的具体摘录或摘要文本，我才能为您进行翻译。

#large-language-models #model-extraction #LLM-security #text-generation #research-paper
1个月前 · it

基于Voynich手稿的替换密码

这里有一篇有趣的论文：《The Naibbe cipher: a substitution cipher that encrypts Latin and Italian as Voynich Manuscript-like ciphertext》：摘要：在本文中，……

#cryptography #substitution-cipher #Voynich-Manuscript #security #research-paper
1个月前 · ai

[Paper] 逃离验证器：通过示例学习推理

训练大型语言模型（LLMs）进行推理通常依赖于带有任务特定验证器的强化学习（RL）。然而，许多现实世界的推理‑

#LLM #reinforcement learning #reasoning #research paper
1个月前 · ai

[Paper] 超越 URL：元数据多样性与位置用于高效 LLM 预训练

在大型语言模型（LLMs）预训练中加入metadata最近被视为一种加速训练的有前景的方法。然而，以前的工作强调……

#LLM pretraining #metadata #training efficiency #research paper #large language models
1个月前 · ai

[论文] 控制对注意力 logits 的更改

在训练 transformer 模型时，神经网络权重的稳定性至关重要。查询（query）和键（key）权重尤其成问题，因为它们倾向于增长……

#attention #transformer training #learning rate scaling #model stability #research paper
1个月前 · ai

[Paper] Agint：Agentic Graph Compilation for 软件工程代理

基于LLM的编码代理正变得越来越普遍，但仍面临上下文管理、延迟、可靠性、可重复性和可扩展性方面的挑战。我们预…

#agentic AI #LLM coding assistants #graph compilation #software engineering automation #research paper