· devops
[论文] Predictive-LoRA:一种主动且碎片感知的无服务器推理系统,适用于 LLMs
无服务器计算范式为部署大型语言模型(LLM)推理服务提供了引人注目的优势,包括弹性伸缩和按使用付费……
无服务器计算范式为部署大型语言模型(LLM)推理服务提供了引人注目的优势,包括弹性伸缩和按使用付费……
大型语言模型(LLMs)的进展为自动化软件漏洞修复方法铺平了道路,这些方法会迭代地细化补丁,直至……
多代理系统扩展了代理式 AI 的能力。与单次推理不同,多个代理进行集体推理,以得出高……
分布式稀疏矩阵-矩阵乘法(SpMM)是众多高性能计算和深度学习应用中的基础操作。The maj...
近二十年来,population protocols 已被广泛研究,为分布式计算中的核心问题提供了高效的解决方案,包括……
进化神经架构搜索(ENAS)因能够自动设计神经网络架构而受到关注。最近的研究使用神经预测器……
矩阵乘积态(MPS)是一种多功能的张量网络表示,广泛应用于量子物理、量子化学和机器学习等领域。MPS …
大多数关于 cognitive maps 的计算模型假设,稳定性主要通过 sensory anchoring 实现,self‑motion 对增量…
Point-based Differentiable Rendering (PBDR) 实现了高保真 3D 场景重建,但将 PBDR 扩展到高分辨率和大场景需要高效…
针对基数约束的投资组合优化的元启发式算法需要修复算子将不可行的候选解映射到可行区域。Stan...
跨模态的深度表征本质上是交织在一起的。在本文中,我们系统地分析了各种语义和……的光谱特性。
生成逼真的 human-human 交互是一项具有挑战性的任务,它不仅需要高质量的单体身体和手部动作,还需要连贯的……