在 Go 中构建 B 树：理论与实现之间的差距

发布: 3周前 (2026年1月14日 GMT+8 18:33)

6 分钟阅读

原文: Dev.to

Source: Dev.to

（此处未提供需要翻译的正文内容。如需翻译，请提供完整的文章文本。）

为什么使用 B‑树？

我不会在这里重新解释 B‑树——《Database Internals》第 2 章已经把它讲得非常出色。本文假设你已经了解基础知识，重点讨论我在构建 B‑树时学到的内容。

问题	我的收获
分裂级联	插入键可能会触发向上级的分裂级联。必须正确更新每个父子指针。
内部节点分裂	不仅仅是移动一两个键——必须重新连接整个子图的子节点并修正它们的父指针。
B 树与 B+ 树	B 树在每个节点存储数据；B+ 树仅在叶子节点存储数据（叶子之间通过链表链接以实现快速范围扫描）。我的实现一旦找到键就停止搜索，这很优雅，但会导致范围查询成本高。
偏斜插入	插入顺序键（1, 2, 3, …）会产生一个只有 50 个键的 7 层深树——一种病态情况，凸显了批量加载策略和 `REINDEX` 的必要性。
随机插入	产生了一个平衡良好的 3 层树，展示了 B 树的自然自平衡特性。

我在任何实现代码之前就编写了 20+ 单元测试（覆盖率 100%）*，*这些测试迫使我思考边界情况，并提前定义了“完成”的标准。

当所有测试最终全部通过时，信心立刻油然而生——不再需要祈祷，只剩下确信。

我计划深入研究 LSM‑树（日志结构合并树），它们颠倒了权衡：

实现压缩策略将是下一层的乐趣。 🤩

如果你对数据库内部原理感兴趣：

阅读与实现之间的差距正是产生真正魔法的地方。

你可以在我自托管的 GitLab 上看到完整实现（是的，我自己跑着实例：极客生活）。如果发现改进之处，欢迎提交 Pull Request！ 😊