[Paper] 流处理系统中的性能优化:实验驱动的 Kafka Streams 配置调优
配置 stream processing systems 以实现高效性能,尤其是在 cloud-native deployments 中,是一项具有挑战性且主要依赖人工的任务。我们提出了一个…
配置 stream processing systems 以实现高效性能,尤其是在 cloud-native deployments 中,是一项具有挑战性且主要依赖人工的任务。我们提出了一个…
Aggregate Programming (AP) 是一种用于编程分布式设备集合的集体行为的范式,这些设备可能位于网络的边缘,通过 …
这是《The Semantic Arrow of Time》五篇论文中的第二篇。第一部分已经确立,computing 的时间之箭是语义性的,而非热力学的……
每一次链路断开或抖动都会破坏数据中心中网络的自我认知——即它的图结构。我们将这种破坏称为 ghost:一个看似可达的节点。
大规模、稀疏、多模态和具备代理能力的 AI 模型的出现恰逢硬件向集成 hun… 的超级节点架构转变。
AI 辅助编码 vs. 团队层面瓶颈 AI 辅助编码工具正在帮助开发者比以往更快地生成代码。那么,为什么团队的交付速度仍然不快……
Serverless 计算和流处理代表了两种主导的事件驱动数据处理范式,但它们都做出了一些假设,使其在许多真实工作负载下效率低下。Serverless 平台假设每次函数调用是相互独立的,这阻止了跨调用重用状态。流处理系统假设数据流是无限的,这迫使它们无限期地保留状态。在本文中,我们提出了一种新模型,称为 “stateful serverless”,它融合了两者的优势:允许函数在调用之间保留和共享状态,同时仍提供 Serverless 的弹性和按需付费定价模型。我们在 Apache Flink 和 AWS Lambda 之上实现了原型,并在包括 real‑time analytics、online machine learning 和 complex event processing 在内的一系列 benchmark 中进行评估。结果表明,stateful serverless 相比传统 Serverless 可实现最高 3× 的 latency 降低和 2× 的 throughput 提升,资源使用相当。我们还讨论了该新模型在 debugging、monitoring 和 security 方面的挑战,并概述了未来工作的方向。
我们描述了在两个求解器的重叠网格区域中进行解数据插值的可扩展算法的应用。此特性对于……
在 S/4HANA 中破损的自定义 ABAP 代码 从工程师的视角来看,棕地 S/4HANA 转型中最先遇到的头疼问题之一就是自定义 ABAP 代码……
Parameter-Efficient Fine-Tuning (PEFT) 在数据中心中被广泛用作大语言模型(LLM)定制的微调 API 的后端。Service…
我们研究未决定状态动力学(Undecided-State Dynamics,USD),这是一种基本的共识过程,其中每个顶点持有 k 种已决定的意见之一或未决定状态。我们 con...
大规模 AI/ML 训练系统依赖于两个很少被审视的假设:(1) checkpoints 代表全局训练状态的原子快照,...