手动关系发现无法扩展。即使使用SQL也不行。

发布: 2个月前 (2026年2月4日 GMT+8 22:05)

4 分钟阅读

原文: Dev.to

Source: Dev.to

成对比较的爆炸

让我们从大多数团队从未明确写下的数学公式开始。

如果你有：

这就是 5,000 个字段。

要检查潜在的关系，你比较的不是表，而是字段。这意味着：

5,000 × 5,000 = 25,000,000

种可能的比较。

即使你极力缩小搜索空间，数字仍然非常庞大。大型企业在系统中常常拥有数万字段，手动探索根本跟不上组合增长的速度。

最朴素的做法显而易见：

“把字段之间的值进行比较，看看有什么匹配。”

在小规模时，这种方法有效。但在真实规模下，它会崩溃。

在许多环境中，完整比较不仅慢，而且在运营上几乎不可能。这也是团队悄悄回避它的原因，即使他们知道这样会更“正确”。

为了解决这个问题，团队往往妥协，进行抽样：

然后肉眼观察重叠。这看似务实，却引入了一类新问题。

手动抽样没有统计依据，缺乏可重复性，也没有可辩护的停止点。它用人为偏差取代了计算限制。

SQL 在执行已知逻辑方面表现卓越，却不适合发现未知结构。关系发现要回答的问题包括：

这些不是查询问题，而是推理问题。试图用临时的 SQL 来解决，就像用电子表格去逆向工程编译器。

在大规模下，关系发现需要：

这正是手动方法失败的原因——不是因为工程师效率低下，而是因为问题本身属于不同的类别。除非团队把关系发现视为一种算法能力，而不是手动任务，否则 SQL 只能充当调试工具，而不是解决方案。猜测的循环将继续下去。