· ai
[Paper] 评估视觉语言模型在不常见动作上的编码能力
我们提出了 UAIT(Uncommon-sense Action Image-Text)数据集,这是一项新的评估基准,旨在测试视觉语言模型的语义理解能力……
我们提出了 UAIT(Uncommon-sense Action Image-Text)数据集,这是一项新的评估基准,旨在测试视觉语言模型的语义理解能力……
在复杂的、非结构化环境中实现稳健的人形徒步,需要从被动的本体感知转向主动的感知。然而,int...
在本工作中,我们提出了一种分布式实现的原始-对偶混合梯度(PDHG)算法,用于求解大规模线性规划(LP)问题……
近期在大型语言模型(LLMs)方面的进展推动了对软件工程的大量评估。然而,大多数先前的工作集中在代码层面的…
本研究分析了现代 NVIDIA GPU 中可用的主要隔离机制:MPS、MIG,以及最近的 Green Contexts,以确保可预测的推理时间……
蚁群优化(ACO)是一种著名的群体智能算法,广泛用于路径规划。然而,传统的ACO方法常常表现出 s...
背景:AI 和机器学习(ML)系统在敏感领域的广泛采用引发了对其公平性的严重担忧。已经提出了许多方法来...
交互式和自主 AI 系统的快速发展标志着我们进入了 agentic 时代。对代理在复杂的 agentic 任务上进行训练和评估……
大型语言模型(LLMs)的快速进步及其与自主代理系统的整合,为文档 a...
自主纳米无人机,由基于视觉的 TinyML(微型机器学习)模型驱动,是一种新兴技术,因其广泛的应用前景而日益受到关注。
平方公里阵列天文台(SKAO)因其数据的庞大规模和复杂性而面临前所未有的技术挑战。本文提供…
我们推出 OpenTinker,这是一套用于大语言模型(LLM)代理的强化学习(RL)基础设施,围绕算法层面的关注点分离构建……