· ai
[Paper] Speculative Decoding 光速:通过分支随机游走的最优下界
Speculative generation 已成为一种有前景的技术,通过利用并行性来验证多个…,加速大型语言模型(LLMs)的推理。
Speculative generation 已成为一种有前景的技术,通过利用并行性来验证多个…,加速大型语言模型(LLMs)的推理。
从大量非结构化的历史报纸档案中提取连贯且人类可理解的主题面临重大挑战,原因是……
检索增强生成(RAG)模型依赖检索到的证据来指导大型语言模型(LLM)生成器,然而当前系统将检索视为……
我们考虑审计 black-box 大型语言模型(LLMs)的问题,以确保它们在生产环境中部署时能够可靠运行,特别是在……
社交媒体在现代政治中是关键的媒介,因为它既反映了政治家的意识形态,又促进了与年轻一代的沟通。
对牙科中的多模态数据进行可靠的解释对于自动化口腔健康护理至关重要,然而当前的多模态大语言模型(MLLMs)仍面临困难……
在视频理解中,关键帧选择面临重大挑战。传统的 top‑K 选择方法会独立对帧进行打分,往往会失败于……
大型语言模型(LLMs)在自然语言理解和推理方面展现出卓越的能力,但却存在幻觉问题:生成的 f...
Reinforcement learning (RL),此前已被证明在大型语言模型和多模态模型中有效,已成功扩展用于提升二维图像生成……
尽管归一化层长期被视为深度学习架构中不可或缺的组成部分,最近引入的 Dynamic Tanh (DyT) 已经……
许多最先进的 LLM 被训练成在给出答案之前先思考。推理可以大幅提升语言模型的能力和安全性,但它也会……
社交存在是共同观看内容时享受的核心,但现代媒体消费正日益趋向于孤立。我们调查是否多代理…