[Paper] 从 sunblock 到 softblock:分析已发表写作和社交媒体中 neology 的相关因素
活语言受到大量相互冲突的内部和外部进化压力的塑造。虽然其中一些压力在所有语言中都是普遍的……
活语言受到大量相互冲突的内部和外部进化压力的塑造。虽然其中一些压力在所有语言中都是普遍的……
大型语言模型(LLMs)正日益被用作评判者,以取代在成对评估中昂贵的人类偏好标签。尽管它们很实用,LLM j...
使用 NLP 分析真实的学习者语言有助于构建自动化评估和反馈工具。它还提供了对发展全新且广泛的洞见。
Memory-efficient backpropagation(MeBP)使得在内存不足1GB的移动设备上对大规模语言模型(LLMs)进行一阶微调成为可能。然而……
理解大语言模型(LLMs)为何以及如何失败正成为一个核心挑战,因为模型快速演进,而静态评估跟不上。虽然…
Context distillation 使语言模型能够将上下文中的知识内化到其参数中。在我们的工作中,我们提出了 On-Policy Context Distillation(...)。
Diffusion large language models (DLLMs) 有潜力通过并行解码多个 token 来实现快速文本生成。然而,在实践中,它们的 i...
尽管 speech recognition systems 在 standard benchmarks 上实现了低 word error rates,但它们在实际部署中的短小、高风险 utterances 往往会失败。
延迟敏感的语音应用(例如实时转录、语音指令和实时翻译)需要低的 time-to-first-token (TTFT) 和高的 transc...
数据混合——确定来自不同领域的数据比例——是训练语言模型(LMs)的首要关注点。虽然现有的混合方法……
高效的长上下文处理仍然是当代大型语言模型(LLMs)的关键挑战,尤其在资源受限的环境中。因此……
AI模型在文本推理方面已经取得了state-of-the-art的成果;然而,它们在对空间和关系结构进行推理的能力仍然是一个关键的……