· ai · - · -
[Paper] 是否推理:医学问答中的选择性 Chain-of-Thought
目标:通过避免不必要的推理,同时保持……,提升使用大型语言模型(LLMs)进行医学问答(MedQA)的效率。
目标:通过避免不必要的推理,同时保持……,提升使用大型语言模型(LLMs)进行医学问答(MedQA)的效率。
大型语言模型(LLMs)是如何知道它们所知道的内容的?要回答这个问题一直很困难,因为预训练数据往往是一个“黑箱”——未知的……
检索增强生成(RAG)通过在生成时条件化检索到的外部文档来提升大语言模型(LLMs),但检索的效果……
大型语言模型(LLMs)在人类获取信息的方式中发挥着关键作用。虽然它们的核心用途依赖于理解书面请求,但我们对……
在本研究中,大型语言模型(LLM)的输出被视为一种信息源,生成从有限字母表中抽取的无限符号序列……
大型语言模型正在被部署在复杂的 socio-technical 系统中,这暴露了当前 alignment 实践的局限性。我们持有的立场是 d...
大型语言模型(LLMs)在数学、编码等各个领域的推理任务上取得了显著进展。然而,它们的表现……
全面检索多样化文档对于处理允许广泛有效答案的查询至关重要。我们提出了 retrieve-verify-retrieve (RVR)…
本研究提出了一种集成技术 SPQ(SVD-Pruning-Quantization),用于大语言模型(LLM)压缩,结合了保留方差的奇异值...
本文提出了一个直接框架,用于在 U(d) 的闭子群上构建具有隐藏状态的序列模型。我们采用最小公理化设置,并推导出递归……
现实世界的知识表示通常需要捕捉主观的、连续的属性——例如政治立场——这些属性与成对的…
在印度等司法管辖区,法院面临大量案件积压,人工智能为法律判决预测提供了变革性的潜力……