nlp — Page 14 | EUNO.NEWS

排序:

0个月前 · ai · - · -

[Paper] 自我改进的多语言长推理通过翻译-推理集成训练

长推理模型在多语言环境中常常遇到困难：它们倾向于对非英语问题使用英语进行推理；当被限制在...

#research #paper #ai #nlp
0个月前 · ai · - · -

[Paper] 多语者还是众多？多语言LLM 对价值取向的多项选择题的回答

多项选择题（MCQs）常用于评估大型语言模型（LLMs）中编码的知识、推理能力，甚至价值观。虽然...

#research #paper #ai #nlp
0个月前 · ai · - · -

[Paper] DARWIN：动态代理式重写自我改进网络

DARWIN 是一种进化型 GPT 模型，利用类似遗传算法的优化结构，对多个独立的 GPT 代理进行单独训练……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] ArkTS-CodeSearch：开源 ArkTS 数据集用于代码检索

ArkTS 是 OpenHarmony 生态系统中的核心编程语言，但对 ArkTS 代码智能的研究受到缺乏公开数据集和评估的阻碍。

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 强化注意力学习

通过强化学习（RL）进行后训练已显著提升了大语言模型（LLMs）的推理能力，尤其是在测试时的规模扩展方面。然而，扩展…

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] 重新思考 LLM 强化学习中的 Trust Region

强化学习（RL）已成为微调大型语言模型（LLMs）的基石，近端策略优化（PPO）作为事实上的…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 你的数据中的潜在效应：一种通过对数线性实现的通用机制

训练现代大型语言模型（LLMs）已成为一个名副其实的大杂烩，汇集了旨在引发特定行为的各种算法和数据集，使其…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] CoT 不是真相链：对用于假新闻生成的推理 LLM 的实证内部分析

从生成标题到捏造新闻，Large Language Models (LLMs) 通常在安全假设的前提下，通过它们的最终输出进行评估。

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 分解提示并不能弥补知识鸿沟，但能帮助模型说‘I Don't Know’

大型语言模型在闭卷问答中常常难以识别自身的知识限制，导致自信的幻觉。虽然分解...

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] Horizon‑LM：一种以RAM为中心的LLM训练架构

大型语言模型（LLMs）的快速增长已经超出了单GPU硬件的演进速度，使得模型规模越来越受到内存容量的限制。

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] SE-Bench：基准测试自我进化与知识内化

真正的自我进化要求代理人作为终身学习者，内化新颖的经验以解决未来的问题。然而，严格衡量这一点……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] OmniSIFT：面向高效全模态大型语言模型的模态不对称令牌压缩

Omni-modal Large Language Models (Omni-LLMs) 已经展示了在音视频理解任务中的强大能力。然而，它们对长多模态……

#research #paper #ai #nlp

Newer posts

Older posts