paper — Page 15 | EUNO.NEWS

排序:

1周前 · ai · - · -

[Paper] 利用 LLMs 进行工业过程自动化

近年来，越来越多的出版物讨论了在软件工程中使用大型语言模型（LLMs）的最佳实践。然而，大多数...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 面向专家投资团队：具备细粒度交易任务的多代理 LLM 系统

大型语言模型（LLMs）的进步加速了自主金融交易系统的发展。虽然主流方法部署多...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] LLM 新手提升在双用途、计算模拟生物学任务中的表现

大型语言模型（LLMs）在生物学基准测试中表现日益出色，但仍不清楚它们是否能提升新手用户——即使人类能够……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] ParamMem：通过参数化反射记忆增强语言代理

Self-reflection 使 language agents 能够迭代地优化解决方案，但往往会产生重复的输出，限制了 reasoning performance。Recent studies ...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] ThinkOmni：通过 Guidance Decoding 将文本推理提升至 Omni-modal 场景

Omni-modal reasoning 对于智能系统理解并从多样化数据源中进行推断是必不可少的。虽然现有的 omni-modal large language …

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] PRIMA：风险集成的图像-元数据对齐预训练用于基于 LLM 的医学诊断

医学诊断需要有效地综合视觉表现和临床元数据。然而，现有方法往往将元数据视为孤立的任务……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] ManifoldGD：免训练层次流形引导用于基于扩散的数据集蒸馏

近年来，大规模数据集阻碍了高效的模型训练，同时也包含冗余概念。Dataset distillation 旨在合成紧凑的数据集……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] SPARTA：可扩展且原则性的树结构多跳问答文本与表格基准

现实世界的表格-文本问答（QA）任务需要模型能够在长文本和源表格之间进行推理，跨越多跳并执行 co...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 为什么 Diffusion Language Models 在真正的并行（非自回归）解码上表现不佳？

扩散语言模型（DLM）常被宣传能够实现并行 token 生成，但实际的快速 DLM 往往会收敛为左到右的自回归模型……

#research #paper #ai #machine-learning #nlp
1周前 · devops · - · -

[Paper] STELLAR：存储调优引擎利用 LLM 自主推理实现高性能并行文件系统

I/O 性能对数据密集型科学计算的效率至关重要；但调优大规模存储系统既复杂、成本高，而且众所周知地需要大量人力。

#research #paper #devops
1周前 · ai · - · -

【论文】InnerQ：硬件感知免调优KV缓存量化用于大语言模型

在解码过程中降低大型语言模型（LLMs）的硬件占用对于高效的长序列生成至关重要。一个关键瓶颈是 key-...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 微调不忘记上下文学习：线性注意力模型的理论分析

基于Transformer的大型语言模型展现了上下文学习能力，使其能够通过少样本提示和示例来适应下游任务。在实践中……

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts