[论文] Prune4Web:用于网页代理的 DOM 树剪枝编程
Web 自动化利用智能代理通过模仿人类与网页界面的交互来执行高级任务。尽管最近的 La...
Web 自动化利用智能代理通过模仿人类与网页界面的交互来执行高级任务。尽管最近的 La...
‘以图像思考’已成为推进视觉推理的有效范式,通过注入视觉证据,超越仅文本的思考链……
单元测试是一种必不可少但又费时的技术,用于验证软件并降低回归风险。虽然经典的自动化方法能够有效地…
在不同数据集之间自动化适配软件工程(SE)研究制品对于可扩展性和可重复性至关重要,但它仍然是一个庞大的挑战...
时空视频定位(STVG)需要根据自然语言描述,在未剪辑的视频中同时在时间和空间上定位目标对象。
估计点的法线需要构建局部补丁以提供中心‑周围的上下文,但确定合适的邻域大小是……
对抗逆向强化学习(AIRL)已显示出在通过推断密集奖励函数来解决强化学习(RL)中的稀疏奖励问题方面的潜力。
Recent advances in multimodal large language models (LLMs) have highlighted their potential for medical and surgical applications. However, existing surgical da... 近期在多模态大型语言模型(LLMs)方面的进展凸显了它们在医学和外科应用中的潜力。然而,现有的外科数据……
本文提出了 SIFT‑SNN 框架,这是一种低延迟神经形态信号处理管道,用于实时检测运输中的结构异常。
https://arxiv.org/abs/2305.12345 学习跨多模态的联合表示仍然是多模态机器学习中的核心挑战。当前的主流方法主要依赖于...(此处省略其余内容的中文翻译)
Millions of users across the globe turn to AI chatbots for their creative needs, inviting widespread interest in understanding how such chatbots represent diver... 全球数百万用户在创意需求上转向 AI 聊天机器人,这引发了人们对这些聊天机器人如何呈现多样化内容的广泛兴趣……
尽管大型语言模型(LLMs)在许多任务上取得了最先进的性能,但它们的庞大规模往往导致高计算成本和环境…