MySQL Block Nested-Loop Join (BNL) 算法中，“一次性与 100 行数据进行比较”是如何实现的？

mysql block nested-loop join (bnl) 算法中，“一次性与 100 行数据进行比较”是如何实现的？

MySQL Block Nested-Loop Join (BNL) 算法优化

对于 Block Nested-Loop Join (BNL) 算法，其原理是将外层循环的行结果集存储在 Join Buffer 中，然后用内层表的每一行数据与 Join Buffer 中的所有记录进行比较。这样可以减少内层循环的扫描次数，从而优化查询性能。

举一个简单的例子，如果外层循环结果集有 1000 行数据，使用 Nested-Loop Join (NLJ) 算法需要扫描内层表 1000 次。但是，如果使用 BNL 算法，我们先取出外层表结果集的 100 行存储到 Join Buffer 中。然后，用内层表的每一行数据去和这 100 行结果集做比较。这样，内层表只需要循环 1000/100 = 10 次，减少了 9/10 的扫描次数。

然而，有人提出了一个问题：“Join Buffer 中有 10 行数据，内层表的每一行与 Join Buffer 中的数据进行比较。比较此时是 10 x 内层表的行数。什么是“可以一次性与 100 行数据进行比较”？

要回答这个问题，我们需要了解 Simple Nested-Loop Join 算法的缺点——内表扫描次数太多。BNL 算法改进的地方就在于可以减少内表的扫描次数，甚至可以和 Hash Join 算法一样，仅需扫描内表一次。

Join Buffer 的作用是缓存所有参与查询的列，而不是只有 Join 的列。这使得 BNL 算法可以批量比较，就像示例中所说的“一次性与 100 行数据进行比较”一样。也就是说，Join Buffer 存储了外层表结果集的一部分，内层表的每一行都只需要与 Join Buffer 中缓存的部分外层表行进行比较，而不需要扫描整个内层表。

以上就是MySQL Block Nested-Loop Join (BNL) 算法中，“一次性与 100 行数据进行比较”是如何实现的？的详细内容，更多请关注其它相关文章！