在随机字段上随意加二级索引正在悄悄地杀死你的数据库

发布: 14小时前 (2026年3月3日 GMT+8 14:17)

3 分钟阅读

原文: Dev.to

Source: Dev.to

概述

我们为什么要给 SQL 字段添加索引？是为了让搜索更快，对吧？

但你知道它有一个巨大的缺点吗？写入会变慢，迫使开发者在决定哪些字段应该标记为二级索引时必须更加策略性。

索引示意图

SELECT * FROM book WHERE author = 'C.S. Lewis';

假设有一个 book 表，字段为 (id, title, author, pub_date, isbn)，且包含 100 万行记录，其中只有 20 行的作者是 C.S. Lewis。没有索引时，数据库会扫描整个堆（行的物理存储），导致 全表扫描，复杂度为 O(n)——非常慢。

当你在 author 列上添加索引时：

CREATE INDEX idx_author ON book(author);

数据库会构建一个单独的 B‑Tree 结构，按字母顺序存储作者姓名，并附带指向堆中相应行的指针。查询时会在 O(log n) 时间内遍历 B‑Tree，检索到 20 条匹配指针，然后直接获取这些行。这就是二级索引让读取更快的原因。

插入或更新一行现在涉及两个步骤：

如果一个表有五个二级索引，每次 INSERT 或 UPDATE 必须在磁盘上修改堆以及五个 B‑Tree。这个隐藏的成本会显著降低写入性能。