machine learning — Page 10

排序:

1周前 · ai · - · -

【论文】InnerQ：硬件感知免调优KV缓存量化用于大语言模型

在解码过程中降低大型语言模型（LLMs）的硬件占用对于高效的长序列生成至关重要。一个关键瓶颈是 key-...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 微调不忘记上下文学习：线性注意力模型的理论分析

基于Transformer的大型语言模型展现了上下文学习能力，使其能够通过少样本提示和示例来适应下游任务。在实践中……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[论文] LLMServingSim 2.0：用于异构和解耦 LLM 服务基础设施的统一模拟器

大型语言模型（LLM）服务基础设施正经历向异构化和解耦的转变。现代部署越来越多地集成了多…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 关于去个体化神经元：连续对称性实现动态拓扑结构

本文通过利用一种基于对称性原理的新型 primitives 类别——isotropic activation functions，提出了一种用于 dynamic networks 的创新方法。该...

#research #paper #ai #machine-learning
1周前 · ai · - · -

释放Smart Search：AI如何将查询转化为可操作的洞察

Markdown !Malik Abualzai https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com...

#AI #semantic search #natural language processing #query understanding #intelligent search #machine learning #search relevance
1周前 · ai · - · -

理解 LSTM – 第4部分：LSTM 如何决定忘记什么

在前一篇文章中，我们完成了 LSTM 的第一部分，并得到了计算结果。让我们继续。Forget Gate 当输入为 1 时……

#LSTM #forget gate #recurrent neural networks #deep learning #sigmoid activation #machine learning
1周前 · ai · - · -

[Paper] 在翻译中恢复：高效的基准和数据集自动翻译流水线

多语言大型语言模型（LLM）评估的可靠性目前受到翻译基准质量不一致的影响。现有的...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 现成的 Image-to-Image 模型是击败图像保护方案的全部所需

生成式人工智能（GenAI）的进步促使开发出多种保护策略，以防止图像的未经授权使用。这些方法依赖于...

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] GUI‑Libra：训练原生 GUI 代理以推理和行动，采用动作感知监督和部分可验证的 RL

开源原生 GUI 代理在长期导航任务上仍落后于闭源系统。这一差距源于两个限制：高‑q…

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 代理模型用于岩石-流体相互作用：网格尺寸不变方法

建模岩石‑流体相互作用需要求解一组偏微分方程（PDE），以预测流体的流动行为以及流体与岩石的反应。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 学习与命名具有卓越生存特征的子群

在许多应用中，识别生存时间比总体更长或更短的子群体非常重要。例如，在医学领域，……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 可证明的最后迭代收敛：多目标安全 LLM 对齐的 Optimistic Primal-Dual

人类反馈强化学习（RLHF）在使大型语言模型（LLMs）符合人类偏好方面发挥了重要作用。虽然RLHF与实验…

#research #paper #ai #machine-learning

Newer posts

Older posts