[Paper] 如何正确报告 LLM-as-a-Judge 评估
大型语言模型(LLMs)正日益被用作评估者,以取代人工。虽然具有可扩展性,但它们的判断因特异性不完善和 s...
大型语言模型(LLMs)正日益被用作评估者,以取代人工。虽然具有可扩展性,但它们的判断因特异性不完善和 s...
大型语言模型(LLMs)在通用领域展示了卓越的能力,但它们在抵押贷款金融等专业领域的应用仍面临挑战……
大型语言模型在受控文本生成过程中必须满足严格的正字法约束,但系统性的跨架构评估仍然有限……
尽管神经网络方法最近取得了进展,检测讽刺仍然是自然语言处理(NLP)领域的一项具有挑战性的任务。目前,...
Zipf 定律在语言中的起源尚未确定,跨学科领域对此存在争议。本研究通过几何机制解释了 Zipf 类行为,而无需语言学的……
Can in-context learning (ICL) override pre-trained label semantics, or does it merely refine an existing semantic backbone? We address this question by treating... **翻译:** 上下文学习(ICL)能够覆盖预训练标签语义,还是仅仅对已有的语义骨干进行细化?我们通过将……来探讨这个问题。
大型语言模型(LLMs)已被证明在对用户输入查询提供定义类答案方面效率很高。虽然对于人类而言,提供各种类型的答案,...
平行语音语料库的稀缺严重阻碍了语音到语音翻译(S2ST),常常迫使人们依赖复杂的多阶段流水线。此…
大型音频语言模型(LALMs)在多种任务中表现出色,涵盖从语音识别到通用音频理解等。
Traffic cameras are essential in urban areas, playing a crucial role in intelligent transportation systems. Multiple cameras at intersections enhance law enforc...
开发高性能 GPU 内核对于 AI 和科学计算至关重要,但由于它依赖于专家级的手工编写且可移植性差,仍然具有挑战性。