[Paper] 面向 HPC 的节能协同调度
现代多GPU HPC系统提供了巨大的计算能力,但低效的GPU分配常导致能源浪费和利用率不足。在实践中...
4602 posts from this source
现代多GPU HPC系统提供了巨大的计算能力,但低效的GPU分配常导致能源浪费和利用率不足。在实践中...
符号回归(SR)与遗传编程(GP)旨在直接从数据中发现可解释的数学表达式。尽管它在经验上表现强劲……
单调布尔函数是结构上重要的一类布尔函数,但它们受限的形式对可实现的非线性…
大型音频语言模型(Large Audio-Language Models,LALMs)正日益融入日常应用,但它们的生成偏差仍未得到充分研究。现有的语音公平…
尽管进展迅速,用于序列决策的 LLM(即 LLM 代理)仍然难以产生多样化的输出。这导致了探索不足……
一个稳健的用于地球观测的多模态大语言模型(MLLM)应在真实的输入变化下保持一致的解释和推理。...
个性化图像美学评估(PIAA)旨在预测单个用户对图像的主观评分,这需要对用户特定的美学……
未回收的 e-waste 代表了巨大的经济损失。硬盘驱动器(HDD)构成了有价值的 e-waste 流,需要机器人拆解。Automa...
我们提出了一种用于从表格数据文档中进行声明验证的新方法。近期基于 LLM 的方法要么采用复杂的预训练/微调,要么…
乳腺癌诊断需要快速且精确的工具,但传统的组织病理学方法在术中常常不足。Deep Ultraviole...
视觉语言模型(VLMs)实现了强大的跨模态性能,但最新证据表明,它们过度依赖文本描述,而对...利用不足。
基于纯贪婪更新的迭代对齐方法在实践中表现出惊人的有效性,然而现有的 (O(log T)) KL 正则化 的理论保证仍然有限。
近期在摘要评估方面的进展是基于 model-based metrics 来评估质量维度,例如 completeness、conciseness 和 faithfulness。然而...
Ising machines —— 用于启发式求解 Ising 优化问题的专用硬件 —— 基于概率位(p-bits)已经建立了……
Spiking neural operators 对于 neuromorphic edge computing 具有吸引力,因为 event-driven substrates 原则上可以将稀疏活动转化为更低的 l…
我们介绍 LaviGen,一个将 3D 生成模型重新用于 3D 布局生成的框架。不同于之前从文本推断对象布局的方法……
UAV 视觉语言导航(VLN)要求代理从自我中心视角在复杂的 3D 环境中导航,同时遵循模糊的多步骤 i...
大气雾霾显著降低了野生动物影像的质量,阻碍了对保护至关重要的计算机视觉应用,如动物检测、跟踪、……
具有慢或亚稳行为的随机动力系统在长时间尺度上,在高维环境空间中的未知低维流形上演化。
以透明且用户友好的方式解释机器学习(ML)结果仍然是可解释人工智能(XAI)的一个挑战性任务。In t...
大型语言模型(LLMs)有潜力加速小分子药物设计,因为它们能够对来自多种来源的信息进行推理……
虽然大多数 automated theorem‑proving 方法依赖于 formal proof systems,informal theorem proving 可以更好地与 large language models 的 …
本文探讨了大型语言模型(LLMs)对不同礼貌程度和不礼貌程度的用户提示的响应。礼貌理论由...
随着 AI-assisted video creation 越来越实用,instruction-guided video editing 已成为细化生成或捕获的 footage 的关键。
越南法律文本的复杂性对公众获取司法构成了显著障碍。虽然Large Language Models提供了一种有前景的解决方案……
水下图像常因光在水中的吸收和散射而出现严重的退化,如颜色失真、对比度低以及细节模糊。
现有的 multi-hazard susceptibility mapping (MHSM) 研究通常依赖空间上均匀的模型,独立处理各类灾害,并且提供的表征有限……
Vision Language models (VLMs) 已在广泛的基准测试中展示了强大的性能,但它们常常受到模态主导的影响,即在预测…
最近在语言模型方面的进展显著提升了自然语言理解(NLU)。尽管广泛使用的基准测试表明,大型语言模型……
在 vision-language models (VLMs) 中的推理最近因其在各种下游任务中的广泛适用性而受到显著关注。然而,...
图像地理定位传统上通过基于检索的地点识别或基于几何的视觉定位流水线来解决。最近的进展……
我们提出 HILBERT(HIerarchical Long-sequence Balanced Embedding with Reciprocal contrastive Training),一种跨注意力的多模态框架,用于学习文档……
Reinforcement learning 已经推动了 video reasoning 在 large multi-modal models 中的发展,但主流流水线要么依赖于 on-policy self-exploration,这会导致性能停滞……
强化学习与可验证奖励(RLVR)通常优化结果奖励,而不对中间推理施加约束。这留下……
Time-to-Collision (TTC) 预测是碰撞预防中的关键任务,需要精确的时间预测并理解局部和全局的…
决策者依赖天气预报来种植作物、管理野火、分配水和能源,并为极端天气做好准备。今天,这类预报 e...
本文系统性地基准评估了通过 token pruning 适配的最先进的多语言大型语言模型(LLMs)——一种压缩技术……
大型语言模型正日益在可靠性至关重要的场景中部署,但输出层面的不确定性信号,如 token probabilities、entropy……
就读AP Computer Science Principles(CSP)课程的中学生通常会利用网络资源(例如教程、Q&A网站)来更好地……
软件工程研究在过去几十年中在产出和参与度方面都经历了快速增长。然而,人们仍然对该领域的能力……
代码生成是指根据用户需求自动生成可执行程序。最近,研究人员已经探索了提升 corr… 的方法。
基于适配器的方法已成为对大型语言模型(LLMs)进行持续学习(CL)的成本有效方案,通过顺序学习低秩更新……
大型语言模型(LLMs)日益依赖链式思考(CoT)推理来解决复杂任务。然而,确保推理轨迹既能……
最近的工作提出了 test-time alignment 方法,依赖一个小的 aligned model 作为代理,引导更大的 base(unaligned)model 的生成。T...
在分布式深度学习中,准确预测训练时间对于资源分配、成本估算和作业调度至关重要。我们观察到,f...
我们提出了一个用于德国语手语(DGS)童话的 dataset 和 model,用于进行 sentiment analysis。首先,我们对三个层面的 val…
将复杂结构分解为更简单的子结构是一种强大的技术,具有广泛的应用范围。我们研究了 decomp 的计算……
Swarm protocols 是一种最近引入的形式化方法,用于指定、实现和验证称为 swarms 的点对点系统。一个 swarm 由分布式…