EUNO.NEWS EUNO.NEWS
  • All (7553) +26
  • AI (1274) +4
  • DevOps (368) +2
  • Software (3662) +13
  • IT (2229) +7
  • Education (20)
  • Notice
  • All (7553) +26
    • AI (1274) +4
    • DevOps (368) +2
    • Software (3662) +13
    • IT (2229) +7
    • Education (20)
  • Notice
  • All (7553) +26
  • AI (1274) +4
  • DevOps (368) +2
  • Software (3662) +13
  • IT (2229) +7
  • Education (20)
  • Notice
Sources Tags Search
한국어 English 中文
  • 3周前 · ai

    [论文] 正字约束满足与大型语言模型中的人类难度对齐

    大型语言模型在受控文本生成过程中必须满足严格的正字法约束,但系统性的跨架构评估仍然有限……

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] 提升缅甸新闻分类的 Kolmogorov-Arnold 网络头部微调

    在像缅甸语这样的低资源语言中,分类任务通常只微调最终的分类层,保持预训练编码器的权重冻结。Wh...

    #Burmese NLP #Kolmogorov-Arnold Network #text classification #low-resource languages #KAN heads
  • 3周前 · ai

    [论文] 上下文感知语用元认知提示用于讽刺检测

    尽管神经网络方法最近取得了进展,检测讽刺仍然是自然语言处理(NLP)领域的一项具有挑战性的任务。目前,...

    #sarcasm detection #prompt engineering #retrieval-augmented generation #nlp #large language models
  • 3周前 · ai

    [Paper] 两阶段符号过程中的 Zipf 分布:随机词汇过滤下的稳定性

    Zipf 定律在语言中的起源尚未确定,跨学科领域对此存在争议。本研究通过几何机制解释了 Zipf 类行为,而无需语言学的……

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] 对离线数据选择与在线自我精炼生成的统一理解——后训练 LLM

    离线数据选择和在线自我精炼生成能够提升数据质量,是将大语言模型(LLMs)适配到特定…的关键步骤。

    #LLM fine-tuning #bilevel optimization #data selection #self-refining generation #AI safety
  • 3周前 · ai

    [论文] 语义锚点在上下文学习中的作用:为何小型语言模型无法翻转其标签

    Can in-context learning (ICL) override pre-trained label semantics, or does it merely refine an existing semantic backbone? We address this question by treating... **翻译:** 上下文学习(ICL)能够覆盖预训练标签语义,还是仅仅对已有的语义骨干进行细化?我们通过将……来探讨这个问题。

    #research #paper #ai #machine-learning #nlp
  • 3周前 · ai

    [Paper] Gated KalmaNet:通过测试时岭回归实现的衰减记忆层

    作为对 softmax Attention 的高效替代方案,线性状态空间模型(SSMs)实现了常数内存和线性计算,但仅保持一种有损的、衰减的 s...

    #gated kalmanet #ridge regression #long-context language models #state-space models #AI research
  • 3周前 · ai

    [Paper] TrackList:追溯查询语言多样性以获取开放大型语言模型中的头部和尾部知识

    大型语言模型(LLMs)已被证明在对用户输入查询提供定义类答案方面效率很高。虽然对于人类而言,提供各种类型的答案,...

    #research #paper #ai #nlp
  • 3周前 · ai

    [Paper] 即使有 AI,双射发现仍然困难:OpenEvolve 在新颖双射构建中的机遇与挑战

    进化式程序合成系统,如 AlphaEvolve、OpenEvolve 和 ShinkaEvolve,提供了一种新的 AI 辅助数学发现方法。这些系统...

    #LLM #evolutionary algorithms #bijection discovery #combinatorial mathematics #OpenEvolve
  • 3周前 · ai

    [Paper] Aragog:即时模型路由,实现代理工作流的可扩展服务

    Agentic workflows 已经成为解决复杂多阶段任务的强大范式,但在大规模部署时,由于计算成本高昂,尤其是考虑到 m...

    #model routing #agentic workflows #LLM serving #scalable inference #cost optimization
  • 3周前 · ai

    [Paper] RosettaSpeech:零样本语音到语音翻译(单语数据)

    平行语音语料库的稀缺严重阻碍了语音到语音翻译(S2ST),常常迫使人们依赖复杂的多阶段流水线。此…

    #research #paper #ai #machine-learning #nlp
  • 3周前 · ai

    [Paper] 面向大型音频语言模型的音频令牌压缩

    大型音频语言模型(LALMs)在多种任务中表现出色,涵盖从语音识别到通用音频理解等。

    #research #paper #ai #machine-learning #nlp

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2025