揭秘合并排序:分治排序初学者指南

揭秘合并排序:分治排序初学者指南

归并排序由约翰·冯·诺依曼于 1945 年提出,主要是为了提高大型数据集的排序效率。冯·诺依曼的算法旨在使用分而治之的方法提供一致且可预测的排序过程。这种策略允许归并排序有效地处理小型和大型数据集,保证在所有情况下都能实现稳定的排序,时间复杂度为 o(n log n)

合并排序采用分而治之方法,将数组分割成更小的子数组,对它们进行递归排序,然后将排序后的数组重新合并在一起。这种方法将问题分解为可管理的块,对每个块进行单独排序并有效地将它们组合起来。因此,通过划分排序工作量,该算法即使在大型数据集上也能表现良好。

c++kquote> 递归是一个函数调用自身来解决同一问题的较小版本的过程。它不断分解问题,直到问题足够简单可以直接解决,这称为基本情况。

下面是 javascript 中归并排序的实现,展示了如何递归地拆分和合并数组:

function mergesort(arr) {
    if (arr.length 



<p>为了更好地理解归并排序的工作原理,让我们使用数组来演示整个过程:[38, 27, 43, 3, 9, 82, 10]</p>

<p><strong>第 1 步:递归除法(mergesort 函数)</strong><br>
该数组被递归地分割成更小的子数组,直到每个子数组只有一个元素。这是通过 mergesort 函数中的以下几行实现的:<br></p>

function mergesort(arr) {
    if (arr.length 



<p>这会停止我们的递归。</p>

<p>以下是递归除法的展开方式:</p>

  • 初始调用: mergesort([38, 27, 43, 3, 9, 82, 10])
    • 数组在中点分割: [38,27,43] 和 [3,9,82,10]
  • 上半场:

    • 合并排序([38,27,43])
      • 在中点分割:[38] 和 [27, 43]
    • 合并排序([27, 43])
      • 分为[27]和[43]
    • 子数组 [38]、[27] 和 [43] 现在是单独的元素,可以合并。
  • 下半场:

    • 合并排序([3, 9, 82, 10])
      • 在中点分割:[3, 9] 和 [82, 10]
    • 合并排序([3, 9])
      • 分为[3]和[9]
    • 合并排序([82, 10])
      • 分为[82]和[10]
    • 子数组 [3]、[9]、[82] 和 [10] 现在已准备好合并。

第 2 步:合并已排序的子数组(合并函数)
现在,我们开始使用 merge 函数将子数组按排序顺序合并在一起:

function merge(left, right) {
    let result = [];
    while (left.length && right.length) {
        if (left[0] 



<p>合并过程的工作原理如下:</p>

<p><strong>第一次合并(来自基本情况):</strong></p>

  • 合并 [27] 和 [43] → 结果为 [27, 43]
  • 将 [38] 与 [27, 43] 合并 → 结果为 [27, 38, 43]

此时,数组的左半部分已完全合并:[27, 38, 43]。

第二次合并(来自基本情况):

  • 合并 [3] 和 [9] → 结果为 [3, 9]
  • 合并 [82] 和 [10] → 结果为 [10, 82]
  • 将 [3, 9] 与 [10, 82] 合并 → 结果为 [3, 9, 10, 82]

现在,右半部分已完全合并:[3, 9, 10, 82]。

第 3 步:最终合并
最后,使用 merge 函数将两半 [27, 38, 43] 和 [3, 9, 10, 82] 合并:

比较 27(左[0])和 3(右[0])。由于 3 比较 27 和 9。将结果加上 9。
比较 27 和 10。结果加 10。
比较 27 和 82。将结果加上 27。
比较 38 和 82。结果加上 38。
比较 43 和 82。将 43 添加到结果中。
添加右侧数组中剩余的元素 82。
完全合并和排序的数组是:
[3, 9, 10, 27, 38, 43, 82].

时间复杂度: 最佳、平均和最坏情况:o(n log n)
让我们仔细看看:

除法(o(log n)):每次将数组分成两半,问题的大小就会减小。由于数组在每一步都被分成两半,因此执行此操作的次数与 log n 成正比。例如,如果有 8 个元素,则可以将它们分成两半 3 次(因为 log2(8) = 3)。

合并(o(n)):划分数组后,算法将较小的数组按顺序合并在一起。合并两个大小为 n 的排序数组需要 o(n) 时间,因为您必须对每个元素进行比较和组合一次。

总体复杂度(o(n log n)):由于除法需要 o(log n) 步骤,并且在每一步合并 n 个元素,因此总时间复杂度是这两者的乘积:o(n log n)。

空间复杂度: o(n)
合并排序需要与数组大小成正比的额外空间,因为它在合并阶段需要临时数组来存储元素。

与其他排序算法的比较:
快速排序:虽然快速排序的平均时间复杂度为 o(n log n),但最坏的情况可能是 o(n^2)。合并排序避免了这种最坏的情况,但当空间受到关注时,快速排序对于内存中排序通常更快。
冒泡排序:比合并排序效率低得多,平均和最坏情况的时间复杂度为 o(n^2)

真实世界用法
合并排序广泛用于外部排序,其中需要从磁盘对大型数据集进行排序,因为它可以有效地处理无法放入内存的数据。它也通常在并行计算环境中实现,其中子数组可以利用多核处理进行独立排序。

此外,python (timsort)、java 和 c++ (std::stable_sort) 等库和语言都依赖归并排序的变体来确保排序操作的稳定性,使其特别适合对对象和复杂数据结构进行排序。

结论
由于其稳定性、一致的性能以及对大型数据集排序的适应性,合并排序仍然是理论计算机科学和实际应用中的基本算法。虽然 quicksort 等其他算法在某些情况下可能执行得更快,但合并排序保证的 o(n log n) 时间复杂度和多功能性使其对于内存受限的环境以及维护具有相同键的元素的顺序非常有价值。它在现代编程库中的作用确保了它在现实世界的应用程序中保持相关性。

来源:

  1. knuth,donald e. 计算机编程艺术,卷。 3:排序和搜索。 addison-wesley professional,1997 年,第 158-160 页。
  2. cormen,thomas h. 等人。算法简介。麻省理工学院出版社,2009 年,第 2 章(归并排序)、第 5 章(算法复杂性)、第 7 章(快速排序)。
  3. silberschatz、亚伯拉罕等人。数据库系统概念。 mcgraw-hill,2010 年,第 13 章(外部排序)。
  4. “蒂姆索特。” python 文档、python 软件基础。 python 的 timsort
  5. “java 数组.排序”。 oracle 文档。 java 的 arrays.sort()

以上就是揭秘合并排序:分治排序初学者指南的详细内容,更多请关注其它相关文章!