[论文] 正字约束满足与大型语言模型中的人类难度对齐
大型语言模型在受控文本生成过程中必须满足严格的正字法约束,但系统性的跨架构评估仍然有限……
大型语言模型在受控文本生成过程中必须满足严格的正字法约束,但系统性的跨架构评估仍然有限……
在像缅甸语这样的低资源语言中,分类任务通常只微调最终的分类层,保持预训练编码器的权重冻结。Wh...
尽管神经网络方法最近取得了进展,检测讽刺仍然是自然语言处理(NLP)领域的一项具有挑战性的任务。目前,...
Zipf 定律在语言中的起源尚未确定,跨学科领域对此存在争议。本研究通过几何机制解释了 Zipf 类行为,而无需语言学的……
离线数据选择和在线自我精炼生成能够提升数据质量,是将大语言模型(LLMs)适配到特定…的关键步骤。
Can in-context learning (ICL) override pre-trained label semantics, or does it merely refine an existing semantic backbone? We address this question by treating... **翻译:** 上下文学习(ICL)能够覆盖预训练标签语义,还是仅仅对已有的语义骨干进行细化?我们通过将……来探讨这个问题。
作为对 softmax Attention 的高效替代方案,线性状态空间模型(SSMs)实现了常数内存和线性计算,但仅保持一种有损的、衰减的 s...
大型语言模型(LLMs)已被证明在对用户输入查询提供定义类答案方面效率很高。虽然对于人类而言,提供各种类型的答案,...
进化式程序合成系统,如 AlphaEvolve、OpenEvolve 和 ShinkaEvolve,提供了一种新的 AI 辅助数学发现方法。这些系统...
Agentic workflows 已经成为解决复杂多阶段任务的强大范式,但在大规模部署时,由于计算成本高昂,尤其是考虑到 m...
平行语音语料库的稀缺严重阻碍了语音到语音翻译(S2ST),常常迫使人们依赖复杂的多阶段流水线。此…
大型音频语言模型(LALMs)在多种任务中表现出色,涵盖从语音识别到通用音频理解等。