[Paper] BAMBO:通过 Bayesian Adaptive Multi-objective Block-wise Optimization 构建能力与效率 LLM Pareto 集合
构建 Pareto 集合对于在大型语言模型(LLMs)的能力‑效率权衡中进行导航至关重要;然而,现有的合并技术 r...
构建 Pareto 集合对于在大型语言模型(LLMs)的能力‑效率权衡中进行导航至关重要;然而,现有的合并技术 r...
构建Pareto集合对于在大语言模型(LLMs)的能力‑效率权衡中进行导航至关重要;然而,现有的合并技术……
新音频处理技术正在让数百万观众更容易获取娱乐内容……
LLM之所以有用,是因为它们的泛化能力非常强。但好事会不会太多?我们展示了在狭窄情境中进行少量微调可以……
本文首次提出一种同时引入 lock-freedom 和 recoverability 的转换。我们的转换从 lock-based 实现开始,……
尽管同构 GPU 基础的深度学习(DL)训练非常流行,但拖慢节点(stragglers)的普遍性、原因和影响,以及现有方法的有效性……
大型语言模型(LLMs)在代码生成方面表现出色,但Chain-of-Thought(CoT)提示的帮助机制仍不清楚。
等变神经网络将对称性编码为归纳偏置,并在广泛领域中取得了强大的经验性能。然而,它们的表达能力……
我们描述了 SynthPix,这是一种用于粒子图像测速 (PIV) 的合成图像生成器,重点关注在加速器上的性能和并行性,实现了……
有效的日志异常检测对于维持大规模 IT 基础设施的可靠性至关重要。Transformer‑based 模型需要大量资源……
系统工程正从文档中心转向模型驱动的方法,资产正变得越来越数字化。虽然数字化…
量子电路设计是实现复杂真实世界数据上的实用量子机器学习的关键瓶颈。我们提出了一种自动化框架,能够发现……
任务调度是云计算中的一项关键研究挑战,云计算是一项在各行业广泛采用的变革性技术。虽然已有大量的调度 …
工作流挖掘从事件日志中发现层次化的过程树,但仍不清楚为何这些模型满足或违反逻辑属性,或如何……
可穿戴系统的眼动追踪需要低延迟和毫瓦级功耗,但传统的基于帧的 pipelines 在运动模糊和高 compute 方面表现不佳……
背景。基于LLM的自主代理在软件工程中依赖大型专有模型,限制了本地部署。这激发了对小型语言模型的兴趣。
多种科学和工程研究领域处理大规模相互作用的 delay differential equations 系统中的离散、带时间戳的变化。Simulat...
在共享 GPU 集群中部署多个模型有望提升大语言模型(LLM)服务的资源效率。现有的多 LLM …
向量搜索是现代信息检索系统的基础,包括检索增强生成(RAG)流水线和针对非结构化文本的搜索引擎……
组织对计算机网络的依赖是通过网络可编程性实现的,而网络可编程性通常通过 Service Function Chaining 来实现。这些 c...
如今,视觉智能工具已经无处不在,提供了各种便利和可能性。然而,这些工具的计算需求很高,...
我们提出了一种新颖的 predict-then-optimize 框架用于 maritime search operations,该框架将 trajectory forecasting 与 UAV deployment optimization 相结合——一个端...
Bug fixing 是软件开发过程中的关键活动。在诸如 JIRA 的问题跟踪系统中,每个 bug 报告都会被分配一个优先级,以 i...
自动算法设计领域已经通过诸如 EoH、FunSearch 和 Reevo 等框架得到了推进。然而,它们仅关注算法进化,忽视……