[Paper] 面向价值感知的数值表示用于 Transformer 语言模型
基于Transformer的语言模型通常在数学推理基准上取得强劲的结果,但在基本的数值理解方面仍然脆弱……
基于Transformer的语言模型通常在数学推理基准上取得强劲的结果,但在基本的数值理解方面仍然脆弱……
代码生成任务旨在自动将用户需求转换为可执行代码,显著降低手动开发工作量并提升……
LLMs 正日益被整合到临床工作流程中,但它们往往缺乏 clinical empathy,这是有效 doctor-patient communication 的关键方面。
随着大型语言模型(LLMs)持续扩展,后训练剪枝已成为一种有前景的方法,可在保持性能的同时降低计算成本……
大型语言模型(LLM)路由器会根据给定输入动态选择最优模型。现有方法通常假设可以获取真实标签数据,...
Deep research systems 被广泛用于 multi-step web research、analysis 和 cross-source synthesis,但它们的评估仍然具有挑战性。Existing benc...
多任务学习(MTL)结合低秩适应(LoRA)已成为参数高效部署大型语言模型的有前景的方向。
当今组织希望构建能够处理多种任务的聊天机器人,例如FAQ、troubleshooting、recommendations 和 ideation。我的之前的…
Multi-agent systems 已经发展成为许多应用中的实用 LLM 驱动协作者,通过多样性和交叉检查获得了鲁棒性。然而,m...
词义消歧(WSD)已广泛使用 WordNet、BabelNet 和 Oxford Dictionary of English 等语义框架进行评估。然而,对于...
Taxonomies 构成了跨多个领域的结构化知识表示的骨干,使得 e‑commerce catalogs、semantic search 等应用成为可能,…
Seeded topic modeling、与 LLMs 的集成,以及在摘要数据上的训练是 NLP 工具箱中的新内容。文章《Topic Modeling Techniques for 202...》。