数据结构第22节 堆排序优化




  1. 构建最大堆

    • 将输入数组视为一个完全二叉树的数组表示。
    • 从最后一个非叶子节点开始(即array.length / 2 - 1),对每个节点应用下沉操作,以确保其满足最大堆的性质。
  2. 排序

    • 将堆顶元素(最大值)与堆末尾的元素交换,减少堆的大小,并将新的堆顶元素下沉,使其再次满足最大堆的性质。
    • 重复此过程,直到堆的大小减少到1。


public class HeapSort {
    public static void heapSort(int[] array) {
        // Build heap (rearrange array)
        for (int i = array.length / 2 - 1; i >= 0; i--) {
            heapify(array, array.length, i);

        // One by one extract an element from heap
        for (int i = array.length - 1; i > 0; i--) {
            // Move current root to end
            int temp = array[0];
            array[0] = array[i];
            array[i] = temp;

            // call max heapify on the reduced heap
            heapify(array, i, 0);

    // To heapify a subtree rooted with node i which is an index in array[]
    private static void heapify(int[] array, int heapSize, int i) {
        int largest = i; // Initialize largest as root
        int leftChild = 2 * i + 1; // left child
        int rightChild = 2 * i + 2; // right child

        // If left child is larger than root
        if (leftChild < heapSize && array[leftChild] > array[largest]) {
            largest = leftChild;

        // If right child is larger than largest so far
        if (rightChild < heapSize && array[rightChild] > array[largest]) {
            largest = rightChild;

        // If largest is not root
        if (largest != i) {
            int swap = array[i];
            array[i] = array[largest];
            array[largest] = swap;

            // Recursively heapify the affected sub-tree
            heapify(array, heapSize, largest);



  1. 内联小函数:如果heapify函数很小且频繁调用,可以考虑将其内联到heapSort函数中,以减少函数调用的开销。

  2. 减少数组访问:在heapify函数中,多次访问array中的元素可能会导致缓存未命中,从而影响性能。我们可以通过缓存一些频繁访问的值来减少这种影响。

  3. 边界条件检查:确保在循环中检查边界条件,避免不必要的计算。

  4. 使用循环展开:对于某些循环,使用循环展开可以减少循环控制结构的开销。

  5. 尾递归优化:如果使用了递归的heapify,可以尝试将其转换为迭代版本,因为JVM可能不支持尾递归优化。


public class HeapSortOptimized {
    public static void heapSort(int[] array) {
        int n = array.length;
        // Build heap
        for (int i = n / 2 - 1; i >= 0; i--) {
            int largest = i;
            int leftChild = 2 * i + 1;
            int rightChild = 2 * i + 2;
            if (leftChild < n && array[leftChild] > array[largest]) {
                largest = leftChild;
            if (rightChild < n && array[rightChild] > array[largest]) {
                largest = rightChild;
            if (largest != i) {
                int temp = array[i];
                array[i] = array[largest];
                array[largest] = temp;
                // Recursively heapify the affected sub-tree
                i = largest;
                leftChild = 2 * i + 1;
                rightChild = 2 * i + 2;
                while (leftChild < n) {
                    largest = i;
                    if (array[leftChild] > array[largest]) {
                        largest = leftChild;
                    if (rightChild < n && array[rightChild] > array[largest]) {
                        largest = rightChild;
                    if (largest == i) {
                    temp = array[i];
                    array[i] = array[largest];
                    array[largest] = temp;
                    i = largest;
                    leftChild = 2 * i + 1;
                    rightChild = 2 * i + 2;
        // Extract elements one by one
        for (int i = n - 1; i > 0; i--) {
            int temp = array[0];
            array[0] = array[i];
            array[i] = temp;
            int j = 0;
            int leftChild = 1;
            int rightChild = 2;
            while (leftChild < i) {
                int largest = j;
                if (array[leftChild] > array[largest]) {
                    largest = leftChild;
                if (rightChild < i && array[rightChild] > array[largest]) {
                    largest = rightChild;
                if (largest == j) {
                temp = array[j];
                array[j] = array[largest];
                array[largest] = temp;
                j = largest;
                leftChild = 2 * j + 1;
                rightChild = 2 * j + 2;


堆排序的过程可以分为两个主要阶段:构建最大堆和排序。我将以一个简单的示例数组 [4, 10, 3, 5, 1] 来逐步说明堆排序的过程,并使用表格形式展示每一步的变化。


  1. 初始状态:

    | Index | Value |
    |   0   |   4   |
    |   1   |  10   |
    |   2   |   3   |
    |   3   |   5   |
    |   4   |   1   |
  2. 从最后一个非叶节点开始下沉:

    • 节点 1 (值 10) 是最后一个非叶节点。
    • 节点 1 已经是最大堆的一部分,无需调整。
  3. 节点 0 下沉:

    • 节点 0 (值 4) 有子节点 1 (值 10) 和 2 (值 3),其中最大的是子节点 1。
    • 交换节点 0 和节点 1 的值。
    | Index | Value |
    |   0   |  10   |
    |   1   |   4   |
    |   2   |   3   |
    |   3   |   5   |
    |   4   |   1   |
    • 节点 0 现在是值 10,它没有子节点比它大,所以不需要进一步调整。


| Index | Value |
|   0   |  10   |
|   1   |   4   |
|   2   |   3   |
|   3   |   5   |
|   4   |   1   |


  1. 交换堆顶元素与最后一个元素:

    • 交换节点 0 (值 10) 和节点 4 (值 1)。
    | Index | Value |
    |   0   |   1   |
    |   1   |   4   |
    |   2   |   3   |
    |   3   |   5   |
    |   4   |  10   |
    • 减少堆的大小,不再考虑索引 4。
  2. 调整堆:

    • 节点 0 (值 1) 需要下沉。
    • 交换节点 0 和节点 3 (值 5)。
    | Index | Value |
    |   0   |   5   |
    |   1   |   4   |
    |   2   |   3   |
    |   3   |   1   |
    |   4   |  10   |
    • 节点 0 现在是值 5,它没有子节点比它大,所以不需要进一步调整。
  3. 再次交换堆顶元素与最后一个元素:

    • 交换节点 0 (值 5) 和节点 3 (值 1)。
    | Index | Value |
    |   0   |   1   |
    |   1   |   4   |
    |   2   |   3   |
    |   3   |   5   |
    |   4   |  10   |
    • 减少堆的大小,不再考虑索引 3。
  4. 调整堆:

    • 节点 0 (值 1) 需要下沉。
    • 由于节点 0 没有子节点,不需要进一步调整。

重复以上步骤,直到堆的大小减至 1。


| Index | Value |
|   0   |   1   |
|   1   |   3   |
|   2   |   4   |
|   3   |   5   |
|   4   |  10   |



