[论文] 视频证据推理:通过显式证据定位实现高效视频理解
大型视觉语言模型(LVLMs)在视频推理中面临根本性的两难困境:它们被冗长推理的高昂计算成本所束缚……
4750 posts from this source
大型视觉语言模型(LVLMs)在视频推理中面临根本性的两难困境:它们被冗长推理的高昂计算成本所束缚……
Kolmogorov-Arnold Networks (KANs) 已显示出在高效逼近复杂非线性函数方面的强大潜力。然而,原始的 KAN 公式 r...
使用判别观测量对事件进行分类是许多高能物理分析的核心。然而,bin 边界通常是手工选择的。一个简单的、流行的……
数值推理是金融文档分析中的重要任务。它有助于理解并进行具有逻辑一致性的数值预测。
估计 Riesz 代表元是去偏机器学习中用于因果和结构参数估计的核心问题。针对 Riesz 代表元的各种方法……
在本工作中,我们分析了多种 Wasserstein 距离的变体,这些变体能够将分类聚焦在指定的(片段)部分上。
Self-supervised pre-training with contrastive learning 是一种从稀疏标注数据中学习的强大方法。然而,性能可能会显著下降……
我们提出了 UAIT(Uncommon-sense Action Image-Text)数据集,这是一项新的评估基准,旨在测试视觉语言模型的语义理解能力……
在复杂的、非结构化环境中实现稳健的人形徒步,需要从被动的本体感知转向主动的感知。然而,int...
在本工作中,我们提出了一种分布式实现的原始-对偶混合梯度(PDHG)算法,用于求解大规模线性规划(LP)问题……
近期在大型语言模型(LLMs)方面的进展推动了对软件工程的大量评估。然而,大多数先前的工作集中在代码层面的…
本研究分析了现代 NVIDIA GPU 中可用的主要隔离机制:MPS、MIG,以及最近的 Green Contexts,以确保可预测的推理时间……
蚁群优化(ACO)是一种著名的群体智能算法,广泛用于路径规划。然而,传统的ACO方法常常表现出 s...
背景:AI 和机器学习(ML)系统在敏感领域的广泛采用引发了对其公平性的严重担忧。已经提出了许多方法来...
交互式和自主 AI 系统的快速发展标志着我们进入了 agentic 时代。对代理在复杂的 agentic 任务上进行训练和评估……
大型语言模型(LLMs)的快速进步及其与自主代理系统的整合,为文档 a...
自主纳米无人机,由基于视觉的 TinyML(微型机器学习)模型驱动,是一种新兴技术,因其广泛的应用前景而日益受到关注。
平方公里阵列天文台(SKAO)因其数据的庞大规模和复杂性而面临前所未有的技术挑战。本文提供…
我们推出 OpenTinker,这是一套用于大语言模型(LLM)代理的强化学习(RL)基础设施,围绕算法层面的关注点分离构建……
自我进化方法通过迭代的“generate-verify-refine”循环提升代码生成能力,但现有方法在探索效率方面表现不佳……
自我演化方法通过迭代的“generate-verify-refine”循环提升代码生成能力,但现有方法在探索效率方面表现不足。
自我进化方法通过迭代的“generate-verify-refine”循环提升代码生成能力,但现有方法在探索效率方面表现不足……
Serverless computing 是一种范式,其中底层基础设施由提供商完全管理,使得应用程序和服务能够在...
决策是核心的工程设计活动,传递工程师的知识并将其转化为行动方案。捕捉这种形式的知识……
多代理 AI 系统(MAS)的快速出现,包括 LangChain、CrewAI 和 AutoGen,已经塑造了大型语言模型(LLM)应用的开发方式……
射电天文学依赖于定制、实验性和创新的计算解决方案。随着下一代望远镜的出现,例如 Square Kilometre Array(SKA),这种趋势将继续。
使用基于 LiDAR 的点云数据和深度神经网络进行 3D 目标检测是自动驾驶技术的关键。然而,部署最先进的...
最近的安全代码生成方法,使用漏洞感知微调、前缀微调和提示优化,声称能够防止大型语言模型生成不安全的……
在本文中,分析并讨论了神经形态计算、脉冲神经网络(SNNs)和忆阻器的基础。神经形态计算是 t...
背景:生成式 AI(GenAI)工具的快速出现已经开始重塑各种软件工程活动。然而,它们在敏捷环境中的采用……
随着漏洞研究日益采用生成式 AI,对不透明的模型输出的关键依赖已经出现,导致安全自动化中的“信任鸿沟”。
日志解析将半结构化日志转换为结构化模板,为下游分析奠定关键基础。传统的语法和语义基础……
校准 Agent-Based Models (ABMs) 是模拟复杂社会系统的重要优化问题,目标是确定最优 …
渗透测试对于在真实对手利用之前识别网页应用程序中的漏洞至关重要。近期的工作已经探索了自动化……
由于数据异质性导致的固有客户端漂移,以及系统对拜占庭攻击的脆弱性,阻碍了有效的模型训练和收敛……
准确的性能预测对于在现代高性能计算(HPC)架构上优化科学应用至关重要。广泛使用的perfor...
现代软件包注册中心(如 PyPI)已成为软件开发的关键基础设施,但正日益被威胁行为者利用进行…
虽然自主软件工程(SWE)代理正在重塑编程范式,但它们目前仍受到“封闭世界”限制:它们试图...
本研究旨在通过提出“comparative separation”这一新颖的群体公平概念,以评估 m… 的公平性,从而惠及软件工程领域。
具有丰富反馈的神经结构能够再生早期表征并注入时间上下文,使其成为严格局部突触的自然环境。
向量搜索在 AI 应用中的快速集成,尤其是在检索增强生成(Retrieval Augmented Generation,RAG)方面,已推动了多元化生态系统的出现。
隐私保护的数据处理是指在保证机密性的前提下,对敏感数据进行计算和分析的方法和模型。As cl...
内部威胁是一个特别棘手的网络安全问题,尤其在零信任架构(ZTA)中,隐式信任被移除。虽然规则 o...
我们提出了 Resource-Aware Task Allocator (RATA) 的设计,并对在分布式卫星系统上处理实时任务的实证分析进行了研究。
在敏捷研发(R&D)软件项目中管理技术质量是一项持续的挑战,尤其在特征化的环境中……
AI 批处理作业,例如模型训练、推理流水线和数据分析,需要大量 GPU 资源,并且通常必须在截止日期前完成。Spot...
随着多核嵌入式系统的进步,泄漏功率与芯片温度呈指数关系,已超过动态功耗。能源感知的…
Few-for-many (F4M) 优化,最近作为多目标优化中的新范式被提出,旨在寻找一小组能够有效……