Fabric 2026:更少 ETL,更多“面向代理的 data estate”

发布: (2026年1月14日 GMT+8 02:45)
4 分钟阅读
原文: Dev.to

Source: Dev.to

2026 年概览

如果说 2025 年是大多数人把 Fabric 理解为“统一平台”的一年,那么 2026 年将是它真正成为 AI 数据运营枢纽的一年:更少传统管道,更多零‑ETL、目录/治理,以及日益强大的层用于为 Copilot 和代理提供可靠的上下文。

最客观的了解后续动态的来源是 Microsoft Fabric Roadmap,其中按季度列出了预测和状态(Planned/Preview/Released)【1】。

OneLake 与 Shortcuts

  • OneLake 仍是连接无复制数据的核心。Shortcutsmirroring 减少了传统 ETL 的需求,并将凭据/权限集中在 OneLake 本身【2】。
  • Shortcuts for OneDrive/SharePoint(预览) 将生产力领域的非结构化数据直接带入 lakehouse,无需复制文件或构建管道【3】。
  • Shortcuts with more ingestion control(计划,2026 Q1 公共预览):路线图已指向 “Shortcut Transformations”,允许自定义摄取(格式、去重、解析、错误处理等),从而降低 “我可以使用 shortcut,但需要更细粒度控制” 的摩擦【1】。

Mirroring

Mirroring 正被视为将运营数据“快速带入 OneLake”的近实时通道。相关 GA 公告:

  • 对 SQL Server(2016–2022)和 SQL Server 2025 的 Mirroring 已在 Fabric 中实现【4】。
  • 博客 “What’s new in OneLake…” 提到新的数据源和 Mirroring GA,包括 PostgreSQL、Cosmos DB 以及 SQL Server 2016–2022 与 2025【5】。

架构影响

  • 减少 ETL 与 staging,用于分析的工作负载更简化。
  • 数据更鲜活,适用于 BI 与 AI 场景。
  • 治理集中在湖泊层(权限、血缘、发现),不再分散在各个管道中。

当采用规模化后,讨论的焦点转向:“清单在哪里?”、“谁是所有者?”、“血缘是什么?”、“谁访问过?”、“风险多少?” Administration, Governance and Security 路线图强调目录的演进,提供 Explore/Govern 体验、按域、项目类型、所有者、背书、标签过滤,以及对血缘/权限/活动的访问【6】。

为 AI 做好环境准备的建议

  1. 将 OneLake 作为枢纽 – 通过 shortcuts 减少复制并统一凭据/权限【2】。
  2. Mirroring 用于运营数据 – 优先同步关键源(SQL/PG/Cosmos),以降低 ETL 并加快洞察交付速度【4】。
  3. 将生产力视为数据 – 评估 SharePoint/OneDrive 的 shortcuts,以便在 RAG/agents 中使用工作文档【3】。
  4. 从一开始就做好治理 – 将目录、所有权、标签和血缘纳入 rollout,而不是放在 “第 2 阶段”【6】。
  5. 细粒度控制 – 关注 Shortcut Transformations(2026 Q1)以降低运营摩擦【1】。

参考文献

Back to Blog

相关文章

阅读更多 »