paper — Page 114

1个月前 · ai

[Paper] WarmServe：实现一对多 GPU 预热以支持多LLM服务

在共享 GPU 集群中部署多个模型有望提升大语言模型（LLM）服务的资源效率。现有的多 LLM …

#research #paper #ai #machine-learning
1个月前 · devops

[Paper] 传递接力棒：高吞吐量分布式基于磁盘的向量搜索与 BatANN

向量搜索是现代信息检索系统的基础，包括检索增强生成（RAG）流水线和针对非结构化文本的搜索引擎……

#research #paper #devops
1个月前 · ai

[Paper] 同步遗传进化神经网络用于最优SFC嵌入

组织对计算机网络的依赖是通过网络可编程性实现的，而网络可编程性通常通过 Service Function Chaining 来实现。这些 c...

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] 面向边缘的隐私增强 Vision Transformers 分布式框架

如今，视觉智能工具已经无处不在，提供了各种便利和可能性。然而，这些工具的计算需求很高，...

#research #paper #ai #computer-vision
1个月前 · ai

[Paper] 从预测到行动：不确定性感知 UAV 部署用于 Ocean Drifter 恢复

我们提出了一种新颖的 predict-then-optimize 框架用于 maritime search operations，该框架将 trajectory forecasting 与 UAV deployment optimization 相结合——一个端...

#research #paper #ai
1个月前 · ai

224× 压缩 Llama-70B，获得更高精度（论文与代码）

Article URL: https://zenodo.org/records/17873275 Comments URL: https://news.ycombinator.com/item?id=46212969 Points: 14 Comments: 5...

#model compression #Llama-70B #quantization #deep learning #paper #code
1个月前 · software

[Paper] Bug 优先级变更预测：Apache 软件的探索性研究

Bug fixing 是软件开发过程中的关键活动。在诸如 JIRA 的问题跟踪系统中，每个 bug 报告都会被分配一个优先级，以 i...

#research #paper #software
1个月前 · ai

[Paper] 超越算法进化：一种基于LLM的框架，用于群体智能优化算法与提示的协同进化

自动算法设计领域已经通过诸如 EoH、FunSearch 和 Reevo 等框架得到了推进。然而，它们仅关注算法进化，忽视……

#research #paper #ai
1个月前 · software

[论文] TritonForge：基于性能分析的自动化 Triton 内核优化框架

高性能 GPU kernel 优化仍然是现代机器学习工作负载中一项关键但劳动密集的任务。虽然 Triton，这个领域特定的…

#research #paper #software
1个月前 · ai

[论文] 改进并行 C++ Intel AVX-512 SIMD 线性遗传编程解释器

我们将最近的 256 SSE 向量工作扩展到 512 AVX，实现了四倍加速。我们使用 MAGPIE（Machine Automated General Performance Improvement via Evolution of ...）。

#research #paper #ai
1个月前 · ai

[Paper] 进化卓越：LLM-based Agents 的自动优化

基于大型语言模型（LLMs）的 Agentic AI 系统在自动化复杂工作流方面具有巨大的潜力，涵盖从软件开发到客户支持等领域。

#research #paper #ai #machine-learning
1个月前 · ai

[Paper] Astra: 通用交互式世界模型与自回归去噪

最近在 diffusion transformers 方面的进展使视频生成模型能够从文本或图像生成高质量的视频片段。然而，world model...

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts