MySQL Block Nested-Loop Join (BNL) 算法中,“一次性与 100 行数据进行比较”是如何实现的?

mysql block nested-loop join (bnl) 算法中,“一次性与 100 行数据进行比较”是如何实现的?

MySQL Block Nested-Loop Join (BNL) 算法优化

对于 Block Nested-Loop Join (BNL) 算法,其原理是将外层循环的行结果集存储在 Join Buffer 中,然后用内层表的每一行数据与 Join Buffer 中的所有记录进行比较。这样可以减少内层循环的扫描次数,从而优化查询性能。

举一个简单的例子,如果外层循环结果集有 1000 行数据,使用 Nested-Loop Join (NLJ) 算法需要扫描内层表 1000 次。但是,如果使用 BNL 算法,我们先取出外层表结果集的 100 行存储到 Join Buffer 中。然后,用内层表的每一行数据去和这 100 行结果集做比较。这样,内层表只需要循环 1000/100 = 10 次,减少了 9/10 的扫描次数。

然而,有人提出了一个问题:“Join Buffer 中有 10 行数据,内层表的每一行与 Join Buffer 中的数据进行比较。比较此时是 10 x 内层表的行数。什么是“可以一次性与 100 行数据进行比较”?

要回答这个问题,我们需要了解 Simple Nested-Loop Join 算法的缺点——内表扫描次数太多。BNL 算法改进的地方就在于可以减少内表的扫描次数,甚至可以和 Hash Join 算法一样,仅需扫描内表一次。

Join Buffer 的作用是缓存所有参与查询的列,而不是只有 Join 的列。这使得 BNL 算法可以批量比较,就像示例中所说的“一次性与 100 行数据进行比较”一样。也就是说,Join Buffer 存储了外层表结果集的一部分,内层表的每一行都只需要与 Join Buffer 中缓存的部分外层表行进行比较,而不需要扫描整个内层表。

以上就是MySQL Block Nested-Loop Join (BNL) 算法中,“一次性与 100 行数据进行比较”是如何实现的?的详细内容,更多请关注其它相关文章!