[Paper] “抱歉,我没听清”:语音模型如何错过最重要的内容
尽管 speech recognition systems 在 standard benchmarks 上实现了低 word error rates,但它们在实际部署中的短小、高风险 utterances 往往会失败。
尽管 speech recognition systems 在 standard benchmarks 上实现了低 word error rates,但它们在实际部署中的短小、高风险 utterances 往往会失败。
延迟敏感的语音应用(例如实时转录、语音指令和实时翻译)需要低的 time-to-first-token (TTFT) 和高的 transc...
数据混合——确定来自不同领域的数据比例——是训练语言模型(LMs)的首要关注点。虽然现有的混合方法……
监督微调(SFT)在计算上高效,但相比强化学习(RL)通常会导致较差的泛化能力。这一差距主要是…
AI模型在文本推理方面已经取得了state-of-the-art的成果;然而,它们在对空间和关系结构进行推理的能力仍然是一个关键的……
网络攻击的快速演变持续推动未知(zero-day)威胁的出现,对网络入侵检测构成了重大挑战。
高质量的3D纹理生成仍然是一个根本性的挑战,因为当前主流的 multi-view diffusion pipelines 所固有的视角不一致性。...
为大型语言模型(LLMs)提供服务可以通过在多个设备上并行化模型本身和输入请求而获得巨大的收益,但传入的工作负载……
AI coding agents 正日益为软件开发做出贡献,但它们对移动开发的影响却很少得到实证关注。在这…
现代基于容器的微服务通过快速部署周期不断演进,但 CI/CD 流水线仍很少衡量能耗,尽管已有先前的研究……
已知 Performance antipatterns 会降低 microservice-based systems 的响应性,但它们对 energy consumption 的影响仍然大多未被探索。
TLA+ 中的模型检查提供了强大的正确性保证,但从业者在解释 counterexamples 时仍然面临重大挑战,unders...