· ai · - · -
[Paper] 利用 LLMs 进行工业过程自动化
近年来,越来越多的出版物讨论了在软件工程中使用大型语言模型(LLMs)的最佳实践。然而,大多数...
近年来,越来越多的出版物讨论了在软件工程中使用大型语言模型(LLMs)的最佳实践。然而,大多数...
大型语言模型(LLMs)的进步加速了自主金融交易系统的发展。虽然主流方法部署多...
大型语言模型(LLMs)在生物学基准测试中表现日益出色,但仍不清楚它们是否能提升新手用户——即使人类能够……
Self-reflection 使 language agents 能够迭代地优化解决方案,但往往会产生重复的输出,限制了 reasoning performance。Recent studies ...
Omni-modal reasoning 对于智能系统理解并从多样化数据源中进行推断是必不可少的。虽然现有的 omni-modal large language …
医学诊断需要有效地综合视觉表现和临床元数据。然而,现有方法往往将元数据视为孤立的任务……
近年来,大规模数据集阻碍了高效的模型训练,同时也包含冗余概念。Dataset distillation 旨在合成紧凑的数据集……
现实世界的表格-文本问答(QA)任务需要模型能够在长文本和源表格之间进行推理,跨越多跳并执行 co...
扩散语言模型(DLM)常被宣传能够实现并行 token 生成,但实际的快速 DLM 往往会收敛为左到右的自回归模型……
I/O 性能对数据密集型科学计算的效率至关重要;但调优大规模存储系统既复杂、成本高,而且众所周知地需要大量人力。
在解码过程中降低大型语言模型(LLMs)的硬件占用对于高效的长序列生成至关重要。一个关键瓶颈是 key-...
基于Transformer的大型语言模型展现了上下文学习能力,使其能够通过少样本提示和示例来适应下游任务。在实践中……