了解 Salesforce Data 360 对象:统一客户画像的核心
Source: Dev.to
Introduction
Salesforce Data 360(前称 Data Cloud)正成为大多数新 Salesforce 创新 的基础层。它将实时数据编排与企业级架构相结合,实现客户数据的统一以及洞察的激活。不同于依赖通用核心平台和关系型数据库的传统 Salesforce 云,Data 360 使用专为 PB 级数据构建的独特技术栈,利用 DynamoDB 进行热存储、Amazon S3 进行冷存储等服务。
平台的架构通过一组分层对象组织,这些对象决定了数据的摄取、统一以及最终激活的方式。
Data Object Hierarchy in Salesforce Data Cloud
数据在从外部来源流入统一的 Customer 360 资料时,会经过一系列定义好的对象。
Data Source (The Origin)
提供原始数据的外部系统或服务(例如 Sales Cloud、Commerce Cloud)。
Data Stream (The Entity Path)
Data Stream 是从特定 Data Source 中提取的实体——比如 Sales Cloud 的 “Contacts” 或 Commerce Cloud 的 “Orders”。在设置 Data Stream 时,必须为其分配一个类别:Profile、Engagement 或 Other。一个 Data Source 可以包含多个 Data Stream。
Data Source Object (DSO: The Raw Staging Area)
Data Source Object (DSO) 是 Data Stream 首次被摄取的地方。它充当临时暂存区,以原始、原生文件格式(如 CSV)保存数据。可以在摄取时使用字段公式进行少量转换。
Data Lake Object (DLO: The Prepared Data Store)
Data Lake Object (DLO) 是下一阶段,也是第一个可供检查和准备的对象。它是 DSO 加上任何已应用转换后的产物。DLO 以 Apache Parquet 文件存储在 Amazon S3 中——列式存储以实现高效的存储和检索。它们是有类型、基于模式的、具备物化视图的。
Data Spaces——用于安全和组织的逻辑分区——允许管理员过滤 DLO 并将其分配给特定用户组,确保每个组只能访问相关数据。
Data Model Object (DMO: The Canonical View)
Data Model Object (DMO) 提供对数据湖的虚拟、非物化视图,是统一和激活的关键。
- Canonical Model:DMO 与 Customer 360 数据模型保持一致,提供一套标准的预定义属性(标准对象)。也可以创建自定义 DMO。
- Virtual Nature:对 DMO 的查询不会被存储;它们始终反映底层 DLO 的当前快照。
- Inheritance and Relationships:DMO 从映射到它的第一个 DLO 继承其类别。它可以与其他 DMO 具有标准或自定义关系(1 对 1 或多对 1),类似于标准的 Salesforce 对象。目前已有 89 个标准 DMO,支持各种实体使用场景。
Implementation Best Practices
-
Focus on Traits, Not Raw Events
避免“把全部数据塞进 CRM 对象”。将高基数事件(如点击流数据)保留在 Data 360(DLO 层),仅将汇总后的特征发布回 Salesforce CRM 对象(如 Opportunity 或 Case)用于报表和辅导。 -
Unification vs. Golden Record
Data 360 的统一将来自多个来源的数据合并为可激活的统一视图,而不改变原始数据。它 不是 那种会覆盖源系统的传统“黄金记录”。 -
Start Small and Model Wisely
成功取决于为激活而建模,而不仅仅是报表。采用爬行‑走路‑跑步的方式:先从单一用例入手,学习摄取、统一和激活,再逐步扩展。
理解 Data Cloud 的分层对象模型——Source → Stream → DSO → DLO → DMO——就像制造过程:每个阶段都在精炼原材料,直至成为最终可用的形态,为整个 Salesforce 生态系统的个性化和业务行动提供动力。