DevOps

排序:

17小时前 · devops · - · -

我们将 DevOps 设置从数周缩短到数分钟——了解我们是如何构建 InfraPilot 的

介绍我们一次又一次地遇到同样的问题：搭建生产基础设施既慢又痛苦，而且充满了隐藏的复杂性……

#DevOps #CI/CD #Infrastructure Automation #InfraPilot #Docker #Deployment #Infrastructure as Code
19小时前 · devops · - · -

我们在 AWS、Azure 和 GCP 上运行了 7,600 多个云供应测试——以下是我们的发现

简介没有人公开这些数据，所以我们自行测量。云服务提供商会分享正常运行时间 SLA、定价计算器和功能比较表，但...

#cloud #AWS #Azure #GCP #provisioning #latency #performance #infrastructure #monitoring #devops
3天前 · devops · - · -

零接触的未来：赋能Telstra迈向完全自主、自愈网络

在2026年MWC上，Telstra宣布在与R…合作建设全球最先进的自主网络之一的旅程中迈出了重要一步。

#devops #linux #opensource
3天前 · software · - · -

🧬 Spec-Driven Development：一种进化式方法

探险者使用制图工具绘制自己的地图，象征着构建你自己的 Spec-Driven Development 路径。https://media2.dev.to/dynamic/image/width=800...

#spec-driven development #software engineering #development methodology #devops #agile #Spotify #Chef #team culture #process evolution
3天前 · devops · - · -

[Paper] 基于波的调度用于混合 HPC‑量子系统中的电路切割

基于电路切分的混合高性能计算（HPC）-量子工作负载将大型量子电路分解为独立的片段，但现有的...

#research #paper #devops
3天前 · devops · - · -

[Paper] SCENIC：流计算增强的 SmartNIC

虽然现代的 AI 为中心的数据中心在很大程度上依赖 SmartNIC，但现有设备强加了一个硬性的权衡。商业 SmartNIC 提供高带宽和易……

#research #paper #devops
3天前 · devops · - · -

[Paper] Prefill-as-a-Service：下一代模型的 KVCache 可跨数据中心

Prefill-decode（PD）解耦已成为大规模 LLM 服务的标准架构，但在实际中，它的部署边界仍然由……

#research #paper #devops
3天前 · devops · - · -

[Paper] 多NUMA 虚拟机可用空间的高效计算

对计算能力日益增长的需求促使云服务提供商采用多NUMA服务器，并向客户提供多NUMA虚拟机。然而...

#research #paper #devops
3天前 · devops · - · -

【论文】为大内存占用的链式作业提供服务——在大规模基础模型服务中的应用

作为当前人工智能（AI）的趋势，大型基础模型正日益被用作 AI 服务的核心。然而，即使在训练之后，...

#research #paper #devops
4天前 · software · - · -

我们的 Stripe 交付流水线 — 从结账到下载仅需 30 秒

流程 Stripe Checkout → Webhook → Atlas 监听器 → 文件交付 → 邮件收据总时间：平均约 28 秒步骤 1：Stripe Webhook 我们监听…

#stripe #webhook #checkout #automation #delivery-pipeline #email-receipt #devops
4天前 · devops · - · -

Kubernetes 可观测性：监控什么以及为何

Kubernetes 监控迷宫 Kubernetes 开箱即提供上千个指标。大多数团队监控所有这些指标，却没有理解其中任何一个。经过运行…

#kubernetes #observability #monitoring #metrics #cluster-health #workload-health #alerting #prometheus #devops
4天前 · software · - · -

使用可直接合并的 AI 代码修复实现自动化修复

AI‑Driven Code Security at Scale AI 正在以比任何安全团队能够审查的速度更快地编写代码。过去可管理的静态应用安全积压…

#software #gitlab #devops
4天前 · devops · - · -

[Paper] 临时算力调节拦截攻击

我们考虑针对矿池的区块拦截攻击，尤其是最先进的 Power Adjusting Withholding (PAW) 攻击。我们提出了一种推广……

#research #paper #devops
4天前 · devops · - · -

[Paper] OffloadFS：利用分离式存储进行计算卸载

分离式存储系统通过将存储资源与计算资源分离，提高资源利用率并实现存储和计算资源的独立扩展。

#research #paper #devops
4天前 · devops · - · -

[Paper] SAKURAONE：一种基于开放以太网的 AI 高性能计算系统及其在单租户 LLM 开发环境中的工作负载动态观察

SAKURAONE 是由樱花互联网研究中心开发和运营的托管高性能计算（HPC）集群。它基于 KOKARYOKU PHY ba...

#research #paper #devops
4天前 · devops · - · -

[Paper] 自适应多接入边缘架构：机器人案例

计算密集型 AI 任务的增长凸显了降低处理成本、提升性能和能源效率的需求。这就需要……

#research #paper #devops
5天前 · devops · - · -

[Paper] PackSELL：一种精度无关的高性能SpMV稀疏矩阵格式

我们提出了一种新的稀疏矩阵格式 PackSELL，旨在支持多样的数据表示并实现高效的稀疏矩阵-向量乘法（SpMV）。

#research #paper #devops
5天前 · devops · - · -

[Paper] DySkew：动态数据重分配用于抗倾斜 Snowpark UDF 执行

Snowflake 通过 elastic architecture 革命性地改变了数据仓库，该架构将 compute 与 storage 解耦，提供了可扩展的解决方案，以满足多样化的数据 analytic 需求……

#research #paper #devops
5天前 · devops · - · -

[Paper] 迈向线性代数式 Hypervisor

许多程序合成、超优化和数组编程技术需要对通用程序进行并行展开。GPU，虽然能够…

#research #paper #devops
5天前 · devops · - · -

[Paper] EPAC：最后的舞蹈

本文介绍了 EPAC，这是一款基于 RISC-V 的加速器芯片，作为欧洲处理器计划（EPI）多年度、多合作伙伴努力的一部分而开发。

#research #paper #devops
5天前 · devops · - · -

[Paper] 智能资源预测用于 SAP HANA 持续集成构建工作负载

大型企业通常在大型、异构的计算集群上运行广泛的持续集成（CI）流水线，在这些环境中，保守的、静态定义的……

#research #paper #devops
5天前 · devops · - · -

[Paper] 超越预训练：基础模型在 HPC 系统上的完整生命周期

大规模的基础模型（Foundational Models，FM）预训练构成了一个计算密集型的第一阶段，以实现人工智能在多样的科学和社会领域的应用……

#research #paper #devops
5天前 · devops · - · -

[Paper] 一举三得：通过零阶优化在无线网络上对 LLM 微调解决通信‑内存‑隐私三难困境

联邦学习（FL）为在边缘协同微调大型语言模型（LLMs）提供了一条有前景的路径；然而，这一范式面临着…

#research #paper #devops
6天前 · software · - · -

GitLab 和 Vertex AI 在 Google Cloud 上：推进智能体软件开发

GitLab Duo Agent Platform 与 Google Cloud Vertex AI 合作伙伴关系 GitLab Duo Agent Platform 正在帮助重新定义组织构建、保障和交付软件的方式……

#software #gitlab #devops
6天前 · devops · - · -

[Paper] Nanvix：面向高密度 Serverless 部署的多内核操作系统设计

Serverless 提供商通过优化 deployment density 来实现高 resource utilization：即每台 host server 上可以部署多少应用程序。然而，achi...

#research #paper #devops
6天前 · devops · - · -

[Paper] QuMod：使用电路切割的模块化 QPU 并行量子作业调度

量子计算社区正日益将 quantum processors 定位为经典 HPC 工作流中的加速器，类似于 GPUs 和 TPUs。然而...

#research #paper #devops
1周前 · devops · - · -

[Paper] RouterWise：面向延迟感知的多模型 LLM 服务的联合资源分配与路由

Multi-model LLM routing 已成为一种有效的方法，通过将每个 prompt 分配给 …，在保持输出质量的同时降低服务成本和延迟。

#research #paper #devops
1周前 · devops · - · -

SRE 周刊第512期

在 sreweekly.com 查看 https://sreweekly.com/sre-weekly-issue-512/ 提高鲁棒性需要增加复杂性。我们要向它投放更多的复杂性吗？ > 我是 u...

#devops #sre #reliability
1周前 · devops · - · -

超越控制台：现代 DevOps 在 AWS 上的架构指南

AWS 上的现代 DevOps 工程师云环境在过去的几个开发周期中发生了巨大的变化。当我第一次开始使用 AWS 时，...

#AWS #DevOps #cloud architecture #internal developer platforms #automation #self‑healing systems #infrastructure as code #CI/CD
1周前 · devops · - · -

我作为高中演讲者在第一次 KubeCon + CloudNativeCon 上学到的内容

!Dan Kohn 奖学金获得者，Avery 在阿姆斯特丹 https://www.cncf.io/wp-content/uploads/2026/04/Avery_AMS_SR-1.jpg KubeCon + CloudNativeCon Europe 2026 是……

#devops #cloud-native #kubernetes
1周前 · software · - · -

系统设计期间检测架构漂移

介绍：一个团队发布了一个功能。几周后，出现了安全缺陷——这不是代码中的 bug，而是架构上的缺陷。API gateway 直接…

#architecture drift #design review #software architecture #security compliance #AI coding assistants #devops
1周前 · devops · - · -

[Paper] 维持 Exascale 性能：来自 Aurora 上 HPL 与 HPL-MxP 的经验教训

在生产环境中维持 exascale 性能需要在真实部署约束和需求下才会出现的工程选择和运维实践。

#research #paper #devops
1周前 · devops · - · -

CloudBees兑现AI承诺，提升应用测试

CloudBees 已正式发布了一款用于持续集成/持续部署（CI/CD）平台的 add‑on，使用人工智能（AI）来确定…

#devops #ci-cd #automation
1周前 · devops · - · -

在 Workday 中使用 PECI 和 PICOF 构建端到端薪资集成

概述：将 Workday 与第三方薪资系统集成对使用 Workday HCM、但在全球依赖外部薪资提供商的组织至关重要。

#devops #tutorials #best-practices
1周前 · devops · - · -

窗口中的那项 AI 订阅多少钱？

对Anthropic和OpenAI之间日益激烈的AI订阅战争的分析，突出“Single Prompt Sinkhole”现象，即高级用户耗尽……

#devops #ci-cd #automation
1周前 · devops · - · -

Google 的 Scion 为开发者提供更智能的并行运行 AI 代理方式

Google 的开源 Scion 测试平台让开发者能够在本地和远程集群上运行隔离的并行 AI 代理。以下是其工作原理……

#devops #ci-cd #automation
1周前 · devops · - · -

科学研究的 AI：使用 Red Hat AI 构建科学所需的研究平台

在之前的文章中，我们聚焦于一种能力——它将 large language models LLMs 从通用工具转变为通过特定领域进行研究的工具。

#devops #linux #opensource
1周前 · devops · - · -

Friday Five — 2026年4月10日

Red Hat Summit 注册现已开放，2026 年在亚特兰大的 Red Hat Summit！请在 2 月 23 日前注册，以获取最低价，或通过 gro...

#devops #linux #opensource
1周前 · devops · - · -

从失败到成功：CKS 考试报告与未来 Kubestronauts 的技巧

我在2026年1月11日至2月6日之间获得了CKA、KCNA、CKAD和KCSA。最近，我在3月参加了CKS——这是我剩下的最后一个Kubernetes认证——。

#Kubernetes #CKS #certification #Kubernetes security #exam tips #Linux Foundation #DevOps #cloud-native
1周前 · devops · - · -

[Paper] 通过静态划分和细粒度CPU卸载来抑制GPU利用不足

GPU 计算吞吐量和内存容量的提升为广泛的工作负载带来了重大机遇。然而，高效利用这些资源……

#research #paper #devops
1周前 · devops · - · -

[Paper] NL-CPS：基于强化学习的 Kubernetes 控制平面在多区域集群中的放置

Kubernetes 控制平面节点的放置对于确保集群的可靠性、可扩展性和性能至关重要，因此代表了一个重要的…

#research #paper #devops
1周前 · devops · - · -

[Paper] 城市尺度可视性图分析 via GPU-Accelerated HyperBall

Visibility Graph Analysis (VGA) 是一种关键的空间句法方法，用于理解空间配置如何塑造人类移动，但它依赖于全对全的 BF…

#research #paper #devops
1周前 · devops · - · -

[Paper] 异步量子分布式计算：因果性、快照和全局操作

我们开启对异步量子分布式系统的研究，重点关注实现可分解的 atomic quantum global operations 的情况……

#research #paper #devops
1周前 · devops · - · -

【论文】在多核 OCS 网络中调度 Coflows 并提供性能保证

Coflow 提供了一种关键的应用层抽象，用于捕获通信模式，实现并行数据流的高效协同，以降低 j...

#research #paper #devops
1周前 · devops · - · -

Zencoder 将 OpenClaw 替代方案加入 AI 编码作品集

Zencoder 今天扩展了其用于生成代码的人工智能 AI 代理平台，新增了一项服务，使应用程序开发者能够实现自动化。

#devops #ci-cd #automation
1周前 · devops · - · -

Mallory 推出 AI 原生威胁情报平台，将全球威胁数据转化为优先行动

美国德克萨斯州奥斯汀，2026年4月9日，CyberNewswire...

#devops #ci-cd #automation
1周前 · devops · - · -

[Paper] Wattlytics：用于在 HPC 集群中协同优化性能、能耗和 TCO 的 Web 平台

GPU 加速计算系统日益增长的计算需求和能源足迹使得做出明智的设计和运营决策变得更加复杂。我们提出……

#research #paper #devops
1周前 · devops · - · -

LayerX：Anthropic的Claude代码可以轻易被武器化

LayerX 研究人员成功说服了这款流行的 AI 编码工具绕过其 guardrails 并执行恶意指令……

#devops #ci-cd #automation

Newer posts

Older posts