数据结构与算法之堆排序(堆排序算法分析)

数据结构与算法之堆排序(堆排序算法分析)

编码文章call10242025-02-01 3:56:3912A+A-

堆排序在面试中是经常会问到的,特别是应届毕业生找工作时,面试官最喜欢问这个了。像我这种不入流的大学,平时所学习的算法只是讲讲基本原理,却没有真正要求动手去实现,因此到真正需要应用的时候,根本就不懂如何去应用。

今天,希望通过本篇文章,和大家一起回忆、学习堆排序的相关知识,希望能够和大家一起理解和吸收。

基础知识

我们通常所说的堆是指二叉堆,二叉堆又称完全二叉树或者叫近似完全二叉树。二叉堆又分为最大堆和最小堆。

堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法,它是选择排序的一种。可以利用数组的特点快速定位指定索引的元素。数组可以根据索引直接获取元素,时间复杂度为O(1),也就是常量,因此对于取值效率极高。

最大堆的特性如下:

  • 父结点的键值总是大于或者等于任何一个子节点的键值

  • 每个结点的左子树和右子树都是一个最大堆

最小堆的特性如下:

  • 父结点的键值总是小于或者等于任何一个子节点的键值

  • 每个结点的左子树和右子树都是一个最小堆

算法思想

最大堆的算法思想是:

  • 先将初始的R[0…n-1]建立成最大堆,此时是无序堆,而堆顶是最大元素

  • 再将堆顶R[0]和无序区的最后一个记录R[n-1]交换,由此得到新的无序区R[0…n-2]和有序区R[n-1],且满足R[0…n-2].keys ≤ R[n-1].key

  • 由于交换后,前R[0…n-2]可能不满足最大堆的性质,因此再调整前R[0…n-2]为最大堆,直到只有R[0]最后一个元素才调整完成。

最大堆排序完成后,其实是升序序列,每次调整堆都是要得到最大的一个元素,然后与当前堆的最后一个元素交换,因此最后所得到的序列是升序序列。

最小堆的算法思想是:

  • 先将初始的R[0…n-1]建立成最小堆,此时是无序堆,而堆顶元素是最小的元素

  • 再将堆顶R[0]与无序区的最后一个R[n-1]交换,由此得到新的无序堆R[0…n-2]和有序堆R[n-1],且满足R[0…n-2].keys >= R[n-1].key

  • 由于交换后,前R[0…n-2]可能不满足最小堆的性质,因此再调整前R[0…n-2]为最小堆,直到只有R[0]最后一个元素才调整完成

最小堆排序完成后,其实是降序序列,每次调整堆都是要得到最小的一个元素,然后与当前无序堆的最后一个元素交换,所以所得到的序列是降序的。

提示:堆排序的过程,其实就是不断地扩大有序区,然后不断地缩小无序区,直到只有有序区的过程。

排序过程分析

因为算法比较抽象,这里直接通过举个小例子来说明堆排序的过程是如何的。下面我们用这个无序序列采用最大堆的进行堆排序,所得到的序列就是升序序列(ASC)。

无序序列:89,-7,999,-89,7,0,-888,7,-7

第一步:初始化建成最大堆:

第二步:将堆顶最大元素999与无序区的最后一个元素交换,使999成为有序区。交换后,-7成为堆顶,由于-7并不是无序区中最大的元素,因此需要调整无序区,使无序区中最大值89成为堆顶,所以-7与89交换。交换后导致89的右子树不满足最大堆的性质,因此要对右子树调整成最大堆,所以-7要与0交换,如下图:

从图中看到,当-7成89交换后,堆顶是最大元素了,但是-7的左孩子是0,右孩子是-888,由于-7<0,导致-7这个结点不满足堆的性质,因此需要调整它。所以,0与-7交换。

然后不断重复着第二步的过程,直到全部成为有序区。

最后:所得到的是升序序列

时间复杂度

堆排序的时间,主要由建立初始堆和反复调整堆这两部分的时间开销构成.由于堆排序是不稳定的,它得扭到的时间复杂度会根据实际情况较大,因此只能取平均时间复杂度。

平均时间复杂度为:O( N * log2(N) )

堆排序耗时的操作有:初始堆 + 反复调整堆,时间复杂度如下:

  • 初始建堆:每个父节点会和左右子节点进行最多2次比较和1次交换,所以复杂度跟父节点个数有关。根据2x <= n(x为n个元素可以折半的次数,也就是父节点个数),得出x = log2n。即O ( log2n )

  • 反复调整堆:由于初始化堆过程中,会记录数组比较结果,所以堆排序对原序列的数组顺序并不敏感,最好情况和最坏情况差不多。需要抽取 n-1 次堆顶元素,每次取堆顶元素都需要重建堆(O(重建堆) < O(初始堆))。所以小于 O(n-1) * O(log2n)

使用建议:

由于初始化堆需要比较的次数较多,因此,堆排序比较适合于数据量非常大的场合(百万数据或更多)。由于高效的快速排序是基于递归实现的,所以在数据量非常大时会发生堆栈溢出错误。

C语言实现

基于最大堆实现升序排序

// 初始化堆

voidinitHeap(inta[],intlen){

// 从完全二叉树最后一个非子节点开始

// 在数组中第一个元素的索引是0

// 第n个元素的左孩子为2n+1,右孩子为2n+2,

// 最后一个非子节点位置在(n - 1) / 2

for(inti=(len-1)/2;i>=0;--i){

adjustMaxHeap(a,len,i);

}

}

voidadjustMaxHeap(inta[],intlen,intparentNodeIndex){

// 若只有一个元素,那么只能是堆顶元素,也没有必要再排序了

if(len<=1){

return;

}

// 记录比父节点大的左孩子或者右孩子的索引

inttargetIndex=-1;

// 获取左、右孩子的索引

intleftChildIndex=2*parentNodeIndex+1;

intrightChildIndex=2*parentNodeIndex+2;

// 没有左孩子

if(leftChildIndex>=len){

return;

}

// 有左孩子,但是没有右孩子

if(rightChildIndex>=len){

targetIndex=leftChildIndex;

}

// 有左孩子和右孩子

else{

// 取左、右孩子两者中最大的一个

targetIndex=a[leftChildIndex]>a[rightChildIndex]? leftChildIndex : rightChildIndex;

}

// 只有孩子比父节点的值还要大,才需要交换

if(a[targetIndex]>a[parentNodeIndex]){

inttemp=a[targetIndex];

a[targetIndex]=a[parentNodeIndex];

a[parentNodeIndex]=temp;

// 交换完成后,有可能会导致a[targetIndex]结点所形成的子树不满足堆的条件,

// 若不满足堆的条件,则调整之使之也成为堆

adjustMaxHeap(a,len,targetIndex);

}

}

voidheapSort(inta[],intlen){

if(len<=1){

return;

}

// 初始堆成无序最大堆

initHeap(a,len);

for(inti=len-1;i>0;--i){

// 将当前堆顶元素与最后一个元素交换,保证这一趟所查找到的堆顶元素与最后一个元素交换

// 注意:这里所说的最后不是a[len - 1],而是每一趟的范围中最后一个元素

// 为什么要加上>0判断?每次不是说堆顶一定是最大值吗?没错,每一趟调整后,堆顶是最大值的

// 但是,由于len的范围不断地缩小,导致某些特殊的序列出现异常

// 比如说,5, 3, 8, 6, 4序列,当调整i=1时,已经调整为3,4,5,6,8序列,已经有序了

// 但是导致了a[i]与a[0]交换,由于变成了4,3,5,6,8反而变成无序了!

if(a[0]>a[i]){

inttemp=a[0];

a[0]=a[i];

a[i]=temp;

}

// 范围变成为:

// 0...len-1

// 0...len-1-1

// 0...1 // 结束

// 其中,0是堆顶,每次都是找出在指定的范围内比堆顶还大的元素,然后与堆顶元素交换

adjustMaxHeap(a,i-1,0);

}

}

基于最小堆实现降序排序

// 初始化堆

voidinitHeap(inta[],intlen){

// 从完全二叉树最后一个非子节点开始

// 在数组中第一个元素的索引是0

// 第n个元素的左孩子为2n+1,右孩子为2n+2,

// 最后一个非子节点位置在(n - 1) / 2

for(inti=(len-1)/2;i>=0;--i){

adjustMinHeap(a,len,i);

}

}

voidadjustMinHeap(inta[],intlen,intparentNodeIndex){

// 若只有一个元素,那么只能是堆顶元素,也没有必要再排序了

if(len<=1){

return;

}

// 记录比父节点大的左孩子或者右孩子的索引

inttargetIndex=-1;

// 获取左、右孩子的索引

intleftChildIndex=2*parentNodeIndex+1;

intrightChildIndex=2*parentNodeIndex+2;

// 没有左孩子

if(leftChildIndex>=len){

return;

}

// 有左孩子,但是没有右孩子

if(rightChildIndex>=len){

targetIndex=leftChildIndex;

}

// 有左孩子和右孩子

else{

// 取左、右孩子两者中最上的一个

targetIndex=a[leftChildIndex]

}

// 只有孩子比父节点的值还要小,才需要交换

if(a[targetIndex]

inttemp=a[targetIndex];

a[targetIndex]=a[parentNodeIndex];

a[parentNodeIndex]=temp;

// 交换完成后,有可能会导致a[targetIndex]结点所形成的子树不满足堆的条件,

// 若不满足堆的条件,则调整之使之也成为堆

adjustMinHeap(a,len,targetIndex);

}

}

voidheapSort(inta[],intlen){

if(len<=1){

return;

}

// 初始堆成无序最小堆

initHeap(a,len);

for(inti=len-1;i>0;--i){

// 将当前堆顶元素与最后一个元素交换,保证这一趟所查找到的堆顶元素与最后一个元素交换

// 注意:这里所说的最后不是a[len - 1],而是每一趟的范围中最后一个元素

// 为什么要加上>0判断?每次不是说堆顶一定是最小值吗?没错,每一趟调整后,堆顶是最小值的

// 但是,由于len的范围不断地缩小,导致某些特殊的序列出现异常

// 比如说,5, 3, 8, 6, 4序列,当调整i=1时,已经调整为3,4,5,6,8序列,已经有序了

// 但是导致了a[i]与a[0]交换,由于变成了4,3,5,6,8反而变成无序了!

if(a[0]

inttemp=a[0];

a[0]=a[i];

a[i]=temp;

}

// 范围变成为:

// 0...len-1

// 0...len-1-1

// 0...1 // 结束

// 其中,0是堆顶,每次都是找出在指定的范围内比堆顶还小的元素,然后与堆顶元素交换

adjustMinHeap(a,i-1,0);

}

}

数据测试

// int a[] = {5, 3, 8, 6, 4};

inta[]={89,-7,999,-89,7,0,-888,7,-7};

heapSort(a,sizeof(a)/sizeof(int));

for(inti=0;i

NSLog(@"%d",a[i]);

}

不知道大家理解没有,自己动手画画能帮助我们理解的哦!

点击这里复制本文地址 以上内容由文彬编程网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

文彬编程网 © All Rights Reserved.  蜀ICP备2024111239号-4