· ai
[Paper] 玛丽,吃Cheeseburger的素食者:LLMs 能识别叙事中的不连贯吗?
利用一组配对叙事的数据集,我们研究大型语言模型(LLMs)在可靠区分不连贯和连贯故事方面的程度……
利用一组配对叙事的数据集,我们研究大型语言模型(LLMs)在可靠区分不连贯和连贯故事方面的程度……
许多运营中的云系统使用一个或多个机器学习模型,以帮助它们实现更高的效率和性能。但运维人员缺乏相应的工具……
在上市前药物安全性审查中,将相关不良事件术语分组为标准化的 MedDRA 查询或 FDA 新药办公室自定义医学查询(O...)。
多模态大语言模型(MLLMs)在视觉‑语言理解任务中展示了卓越的能力。虽然这些模型经常产生语言……
在线不文明行为已成为数字社区中广泛且持续存在的问题,对用户造成了巨大的社会和心理负担。Alt...
大型语言模型(LLMs)在代码智能任务(如代码生成、摘要和翻译)中表现出卓越的性能。然而...
随着基于大型语言模型(LLMs)的AI代理日益嵌入社会,协调、控制、委托和问责等问题正变得日益突出。
脉冲神经网络在事件驱动感知方面表现出色,但在长时间尺度上保持任务相关的上下文仍然是一个挑战。然而,在硬件中构建这些网络……
网络拓扑对于在网络上进行分布式学习时实现高效的参数同步至关重要。然而,大多数现有研究并未考虑...
自动驾驶汽车的快速发展导致测试需求激增。传统的测试方法,如虚拟仿真、封闭赛道和……
自动从 natural language requirements 合成 verifiable code 可确保软件的正确性和可靠性,同时显著降低了门槛。
我们研究大型语言模型(LLMs)在作为具备工具使用能力的自主代理时的失败情况。使用 Kamiwaza Agentic Merit Index(KAM)...