ai — Page 103 | EUNO.NEWS

3周前 · ai

[论文] 正字约束满足与大型语言模型中的人类难度对齐

大型语言模型在受控文本生成过程中必须满足严格的正字法约束，但系统性的跨架构评估仍然有限……

#research #paper #ai #nlp
3周前 · ai

[Paper] 提升缅甸新闻分类的 Kolmogorov-Arnold 网络头部微调

在像缅甸语这样的低资源语言中，分类任务通常只微调最终的分类层，保持预训练编码器的权重冻结。Wh...

#Burmese NLP #Kolmogorov-Arnold Network #text classification #low-resource languages #KAN heads
3周前 · ai

[论文] 上下文感知语用元认知提示用于讽刺检测

尽管神经网络方法最近取得了进展，检测讽刺仍然是自然语言处理（NLP）领域的一项具有挑战性的任务。目前，...

#sarcasm detection #prompt engineering #retrieval-augmented generation #nlp #large language models
3周前 · ai

[Paper] 两阶段符号过程中的 Zipf 分布：随机词汇过滤下的稳定性

Zipf 定律在语言中的起源尚未确定，跨学科领域对此存在争议。本研究通过几何机制解释了 Zipf 类行为，而无需语言学的……

#research #paper #ai #nlp
3周前 · ai

[Paper] 对离线数据选择与在线自我精炼生成的统一理解——后训练 LLM

离线数据选择和在线自我精炼生成能够提升数据质量，是将大语言模型（LLMs）适配到特定…的关键步骤。

#LLM fine-tuning #bilevel optimization #data selection #self-refining generation #AI safety
3周前 · ai

[论文] 语义锚点在上下文学习中的作用：为何小型语言模型无法翻转其标签

Can in-context learning (ICL) override pre-trained label semantics, or does it merely refine an existing semantic backbone? We address this question by treating... **翻译：** 上下文学习（ICL）能够覆盖预训练标签语义，还是仅仅对已有的语义骨干进行细化？我们通过将……来探讨这个问题。

#research #paper #ai #machine-learning #nlp
3周前 · ai

[Paper] Gated KalmaNet：通过测试时岭回归实现的衰减记忆层

作为对 softmax Attention 的高效替代方案，线性状态空间模型（SSMs）实现了常数内存和线性计算，但仅保持一种有损的、衰减的 s...

#gated kalmanet #ridge regression #long-context language models #state-space models #AI research
3周前 · ai

[Paper] TrackList：追溯查询语言多样性以获取开放大型语言模型中的头部和尾部知识

大型语言模型（LLMs）已被证明在对用户输入查询提供定义类答案方面效率很高。虽然对于人类而言，提供各种类型的答案，...

#research #paper #ai #nlp
3周前 · ai

[Paper] 即使有 AI，双射发现仍然困难：OpenEvolve 在新颖双射构建中的机遇与挑战

进化式程序合成系统，如 AlphaEvolve、OpenEvolve 和 ShinkaEvolve，提供了一种新的 AI 辅助数学发现方法。这些系统...

#LLM #evolutionary algorithms #bijection discovery #combinatorial mathematics #OpenEvolve
3周前 · ai

[Paper] Aragog：即时模型路由，实现代理工作流的可扩展服务

Agentic workflows 已经成为解决复杂多阶段任务的强大范式，但在大规模部署时，由于计算成本高昂，尤其是考虑到 m...

#model routing #agentic workflows #LLM serving #scalable inference #cost optimization
3周前 · ai

[Paper] RosettaSpeech：零样本语音到语音翻译（单语数据）

平行语音语料库的稀缺严重阻碍了语音到语音翻译（S2ST），常常迫使人们依赖复杂的多阶段流水线。此…

#research #paper #ai #machine-learning #nlp
3周前 · ai

[Paper] 面向大型音频语言模型的音频令牌压缩

大型音频语言模型（LALMs）在多种任务中表现出色，涵盖从语音识别到通用音频理解等。

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts