[Paper] 分段注意力解码与长形式声学编码
我们解决了 attention-based encoder-decoder (AED) 模型与 long-form acoustic encodings 之间的根本不兼容问题。AED 模型在分段的 utterances 上进行训练。
我们解决了 attention-based encoder-decoder (AED) 模型与 long-form acoustic encodings 之间的根本不兼容问题。AED 模型在分段的 utterances 上进行训练。
今天,许多关于 language models 的研究集中在大型通用模型上。然而,许多 NLP pipelines 只需要具有明确定义的、sm...
本文介绍了 JMMMU‑Pro,一个基于图像的日语多学科多模态理解基准,以及 Vibe Benchmark Construction,一个可扩展的…
尼泊尔语是一种低资源语言,拥有超过3200万使用者,因其复杂的语法,在自然语言处理 (NLP) 中仍面临挑战,……
本教程(https://tum-nlp.github.io/low-resource-tutorial)旨在为从事多语言和低资源自然语言处理的 NLP 实践者、研究者和开发者提供帮助。
本文介绍了 PolyPersona,一个用于在多个领域合成 persona 条件的调查响应的生成框架。该框架指...
大型语言模型(LLMs)正日益被用于进化程序和多代理系统,但大多数现有方法依赖于 overwrite-based mutations th...
大型语言模型(LLMs)正日益被用于进化程序和多代理系统,但大多数现有方法依赖于 overwrite‑based 变异……
阿尔茨海默病(AD)是一种进行性的神经退行性疾病,对认知能力产生不利影响。语言相关的变化可以自动……
个人化对于 LLMs 来说变得不可或缺,以便与个人用户的偏好和需求保持一致。然而,当前的方法往往在计算上成本高昂……
我们引入了 Interactive Intelligence,这是一种新颖的数字人范式,能够实现与人格对齐的表达、自适应交互以及自我进化……
法医科学家经常需要在诸如勒索电话、秘密录音、所谓自杀信或匿名...的案件中识别未知的说话者或作者。