[Paper] 组合式设计、实现与验证 Swarms (技术报告)
Swarm protocols 是一种最近引入的形式化方法,用于指定、实现和验证称为 swarms 的点对点系统。一个 swarm 由分布式…
Swarm protocols 是一种最近引入的形式化方法,用于指定、实现和验证称为 swarms 的点对点系统。一个 swarm 由分布式…
随着区块链应用场景的不断扩展,联盟链对共识机制提出了更高的性能和安全性要求。
高性能计算(HPC)应用正日益在异构环境中执行,这为编程和软件带来了新的挑战……
借鉴 continuous integration 的理念,我们提出了针对 high performance applications 的 automated benchmarking pipeline 概念。Customization 和 …
随着 serverless computing 在工业界和学术界的使用日益增长,了解驱动底层平台的机制至关重要。
低地球轨道(LEO)巨型星座将云‑边缘连续体延伸到太空,实现卫星边缘计算。然而,联邦学习(FL)在 …
在2026年MWC上,Telstra宣布在与R…合作建设全球最先进的自主网络之一的旅程中迈出了重要一步。
基于电路切分的混合高性能计算(HPC)-量子工作负载将大型量子电路分解为独立的片段,但现有的...
Docker 沙箱:以 YOLO 模式运行代理,安全地,代理已跨越阈值。超过四分之一的生产代码现在是 AI 编写的,开发者……
虽然现代的 AI 为中心的数据中心在很大程度上依赖 SmartNIC,但现有设备强加了一个硬性的权衡。商业 SmartNIC 提供高带宽和易……
Prefill-decode(PD)解耦已成为大规模 LLM 服务的标准架构,但在实际中,它的部署边界仍然由……
对计算能力日益增长的需求促使云服务提供商采用多NUMA服务器,并向客户提供多NUMA虚拟机。然而...
作为当前人工智能(AI)的趋势,大型基础模型正日益被用作 AI 服务的核心。然而,即使在训练之后,...
系列回顾 - 学习了 Terraform 基础 - 构建了可复用的模块 - 管理了远程状态 - 设计了可用于生产的结构 - 比较了工作空间…
Kubernetes 监控迷宫 Kubernetes 开箱即提供上千个指标。大多数团队监控所有这些指标,却没有理解其中任何一个。经过运行…
我们考虑针对矿池的区块拦截攻击,尤其是最先进的 Power Adjusting Withholding (PAW) 攻击。我们提出了一种推广……
分离式存储系统通过将存储资源与计算资源分离,提高资源利用率并实现存储和计算资源的独立扩展。
SAKURAONE 是由樱花互联网研究中心开发和运营的托管高性能计算(HPC)集群。它基于 KOKARYOKU PHY ba...
计算密集型 AI 任务的增长凸显了降低处理成本、提升性能和能源效率的需求。这就需要……
我们提出了一种新的稀疏矩阵格式 PackSELL,旨在支持多样的数据表示并实现高效的稀疏矩阵-向量乘法(SpMV)。
Docker 沙箱:安全运行 YOLO 模式的代理,2026 年 3 月 31 日 代理已跨越阈值。超过四分之一的生产代码现在由 AI‑authored 编写,且 …
Snowflake 通过 elastic architecture 革命性地改变了数据仓库,该架构将 compute 与 storage 解耦,提供了可扩展的解决方案,以满足多样化的数据 analytic 需求……
许多程序合成、超优化和数组编程技术需要对通用程序进行并行展开。GPU,虽然能够…
本文介绍了 EPAC,这是一款基于 RISC-V 的加速器芯片,作为欧洲处理器计划(EPI)多年度、多合作伙伴努力的一部分而开发。
大型企业通常在大型、异构的计算集群上运行广泛的持续集成(CI)流水线,在这些环境中,保守的、静态定义的……
大规模的基础模型(Foundational Models,FM)预训练构成了一个计算密集型的第一阶段,以实现人工智能在多样的科学和社会领域的应用……
联邦学习(FL)为在边缘协同微调大型语言模型(LLMs)提供了一条有前景的路径;然而,这一范式面临着…
Serverless 提供商通过优化 deployment density 来实现高 resource utilization:即每台 host server 上可以部署多少应用程序。然而,achi...
量子计算社区正日益将 quantum processors 定位为经典 HPC 工作流中的加速器,类似于 GPUs 和 TPUs。然而...
Multi-model LLM routing 已成为一种有效的方法,通过将每个 prompt 分配给 …,在保持输出质量的同时降低服务成本和延迟。
在 sreweekly.com 查看 https://sreweekly.com/sre-weekly-issue-512/ 提高鲁棒性需要增加复杂性。我们要向它投放更多的复杂性吗? > 我是 u...
AWS 上的现代 DevOps 工程师 云环境在过去的几个开发周期中发生了巨大的变化。当我第一次开始使用 AWS 时,...
!Dan Kohn 奖学金获得者,Avery 在阿姆斯特丹 https://www.cncf.io/wp-content/uploads/2026/04/Avery_AMS_SR-1.jpg KubeCon + CloudNativeCon Europe 2026 是……
每次 pod 崩溃时,你都会运行相同的五个命令。其实还有更好的办法。手动调试的问题在于——凌晨 2 点,你的 on‑call 电话响起,一个 pod 在…
Actions 工作流现在限制为 50 次重新运行。今后,如果您尝试对同一工作流重新运行超过 50 次,您将收到一个失败的 check suite …
Dynatrace 本周透露已同意收购 Bindplane,这是一家提供预处理和路由 telemetry 数据平台的供应商。Bob Wambach,副总裁……
在生产环境中维持 exascale 性能需要在真实部署约束和需求下才会出现的工程选择和运维实践。
CloudBees 已正式发布了一款用于持续集成/持续部署(CI/CD)平台的 add‑on,使用人工智能(AI)来确定…
概述:将 Workday 与第三方薪资系统集成对使用 Workday HCM、但在全球依赖外部薪资提供商的组织至关重要。
对Anthropic和OpenAI之间日益激烈的AI订阅战争的分析,突出“Single Prompt Sinkhole”现象,即高级用户耗尽……
如果你从事 DevOps/SRE,几乎都会遇到相同的头疼情况:错误只在 production 出现,alert 整夜响个不停,或者 pipeline 时好时坏。B...
Google 的开源 Scion 测试平台让开发者能够在本地和远程集群上运行隔离的并行 AI 代理。以下是其工作原理……
如果你在使用 monorepo,多个应用在多个环境中独立部署,最终会遇到 GitHub Actions 手…
在之前的文章中,我们聚焦于一种能力——它将 large language models LLMs 从通用工具转变为通过特定领域进行研究的工具。
Red Hat Summit 注册现已开放,2026 年在亚特兰大的 Red Hat Summit!请在 2 月 23 日前注册,以获取最低价,或通过 gro...
我在2026年1月11日至2月6日之间获得了CKA、KCNA、CKAD和KCSA。最近,我在3月参加了CKS——这是我剩下的最后一个Kubernetes认证——。
GPU 计算吞吐量和内存容量的提升为广泛的工作负载带来了重大机遇。然而,高效利用这些资源……
Kubernetes 控制平面节点的放置对于确保集群的可靠性、可扩展性和性能至关重要,因此代表了一个重要的…