nlp — Page 18 | EUNO.NEWS

排序:

1个月前 · ai · - · -

[Paper] RedSage：网络安全通用型 LLM

网络安全运营需要能够支持多样化工作流且不泄露敏感数据的助手 LLM。现有解决方案要么依赖于专有 API……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 在模型仓库中发现隐藏的宝石

公共仓库托管着数百万个微调模型，但社区的使用仍然过度集中在少数基础检查点上……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] Hybrid Linear Attention 正确实现：高效蒸馏与有效架构用于超长上下文

混合Transformer架构结合了softmax注意力块和循环神经网络（RNN），已展示出理想的性能‑吞吐量权衡……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 探索用于智能体的推理奖励模型

Agentic Reinforcement Learning（Agentic RL）在使智能体进行复杂推理和工具使用方面取得了显著成功。然而，大多数方法仍然…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] UEval：统一多模态生成基准

我们推出了 UEval，这是一套用于评估统一模型的基准测试，即能够同时生成图像和文本的模型。UEval 包含 1,000 条专家策划的问题……

#research #paper #ai #nlp #computer-vision
1个月前 · ai · - · -

[Paper] DynaWeb：基于模型的强化学习 Web 代理

自主网页代理的开发，由 Large Language Models (LLMs) 和 reinforcement learning (RL) 驱动，代表了朝向通用…的重大一步。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[论文] FineInstructions：将合成指令扩展到预训练规模

由于监督训练数据有限，大型语言模型（LLMs）通常在庞大的文本语料上通过自监督的“预测下一个词”目标进行预训练。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 边提问边推理：将推理大型语言模型从被动求解器转变为主动询问者

面向推理的 Large Language Models (LLMs) 已经通过 Chain-of-Thought (CoT) 提示取得了显著进展，但它们在根本上仍然受到限制……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 医学中大语言模型训练的联邦与参数高效框架

大型语言模型（LLMs）在医学基准测试中表现出色，包括问答和诊断。为了使它们在临床...

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] ECO: 量化训练无需全精度主权重

量化显著提升了大型语言模型（LLM）训练的计算和内存效率。然而，现有方法仍然依赖于…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 当“更好”的 Prompt 伤害时：评估驱动的迭代用于 LLM 应用

评估大语言模型（LLM）应用与传统软件测试不同，因为其输出具有随机性、高维性，并且对……敏感。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] MAR：通过模块感知架构细化实现高效大语言模型

大型语言模型（LLMs）在各个领域表现出色，但由于 quadratic attention 和密集的 Feed-Forward Network（FFN）操作导致高能耗。

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts