我在 CSV 导入控制台中添加了针对特定配置文件的重复规则 #5
发布: (2026年4月20日 GMT+8 04:55)
3 分钟阅读
原文: Dev.to
Source: Dev.to
背景
在上一步中,我为导入流程添加了公司特定的 CSV 导入配置文件,以便系统能够识别不同来源的格式:
这解决了一个运营问题:不同公司使用不同的列名。
剩余的挑战
不同公司对重复记录的定义也各不相同:
- 有些导入需要在 email 上匹配。
- 有些需要在 公司名称 上匹配。
- 有些只有在 公司名称 + 电话 同时匹配时才视为重复。
对每个文件使用单一的通用重复规则会导致有效行被拦截、错误行漏掉,进而让操作员对工作流失去信任。
配置文件特定的重复规则
在本次更新中,我在导入控制台中加入了 配置文件特定的重复规则。现在,一个配置文件不仅控制列映射,还决定重复检测的方式。
| 配置文件 | 重复规则 |
|---|---|
default | 精确匹配 email |
regional_ops | 精确匹配公司名称 |
partner_directory | 公司名称 + 电话 |
例如,partner_directory 配置文件能够正确识别 CSV 结构,并仅拦截在活动规则(company_name_phone)上冲突的那一行。这正是我们想要的行为:不同的来源格式不应被视为错误数据。
工作流
- CSV 文件直接上传,不进行重写。
- 创建暂存的导入行。
- 若某行被拦截,操作员可以在 UI 中直接编辑该值(例如更改电话号码)。
- 可以在原位重新运行评估。
- 根据跟踪的状态,应用或回滚更改。
审计轨迹完整记录整个过程:
- 哪个配置文件处于激活状态
- 使用了哪条重复规则
- 哪一行被拦截
- 做了哪些修改
- 何时应用了运行
好处
- 防御性导入引擎,能够对脏数据进行暂存。
- 能够识别 公司特定的 CSV 格式。
- 应用 公司特定的重复规则。
- 允许操作员 在原位修复被拦截的行。
- 为每一步保留 审计证据。
联系方式
如果你从事混乱的 CSV 上线、运营导入或审计就绪的导入工作流,欢迎随时联系: