我在 CSV 导入控制台中添加了针对特定配置文件的重复规则 #5

发布: (2026年4月20日 GMT+8 04:55)
3 分钟阅读
原文: Dev.to

Source: Dev.to

背景

在上一步中,我为导入流程添加了公司特定的 CSV 导入配置文件,以便系统能够识别不同来源的格式:

上一篇文章:公司特定的 CSV 导入配置文件

这解决了一个运营问题:不同公司使用不同的列名。

剩余的挑战

不同公司对重复记录的定义也各不相同:

  • 有些导入需要在 email 上匹配。
  • 有些需要在 公司名称 上匹配。
  • 有些只有在 公司名称 + 电话 同时匹配时才视为重复。

对每个文件使用单一的通用重复规则会导致有效行被拦截、错误行漏掉,进而让操作员对工作流失去信任。

配置文件特定的重复规则

在本次更新中,我在导入控制台中加入了 配置文件特定的重复规则。现在,一个配置文件不仅控制列映射,还决定重复检测的方式。

配置文件重复规则
default精确匹配 email
regional_ops精确匹配公司名称
partner_directory公司名称 + 电话

例如,partner_directory 配置文件能够正确识别 CSV 结构,并仅拦截在活动规则(company_name_phone)上冲突的那一行。这正是我们想要的行为:不同的来源格式不应被视为错误数据。

工作流

  1. CSV 文件直接上传,不进行重写。
  2. 创建暂存的导入行。
  3. 若某行被拦截,操作员可以在 UI 中直接编辑该值(例如更改电话号码)。
  4. 可以在原位重新运行评估。
  5. 根据跟踪的状态,应用回滚更改。

审计轨迹完整记录整个过程:

  • 哪个配置文件处于激活状态
  • 使用了哪条重复规则
  • 哪一行被拦截
  • 做了哪些修改
  • 何时应用了运行

好处

  • 防御性导入引擎,能够对脏数据进行暂存。
  • 能够识别 公司特定的 CSV 格式
  • 应用 公司特定的重复规则
  • 允许操作员 在原位修复被拦截的行
  • 为每一步保留 审计证据

联系方式

如果你从事混乱的 CSV 上线、运营导入或审计就绪的导入工作流,欢迎随时联系:

fastapienne@gmail.com

0 浏览
Back to Blog

相关文章

阅读更多 »