Category Archives: 算法&数据结构

算法技术手册 – 查找 – 顺序查找

顺序查找也叫线性查找，是最简单的查找算法。穷举法遍历每个元素，查找是否包含元素t。

平均、最坏性能O(N)
#include <stdio.h>

typedef int TYPE;

int search(TYPE* arr, int n, TYPE t)
{
int i=0;
for(i=0; i<n; i++)
{
if(arr[i]==t)
{
re[......]

算法技术手册 – 排序 – 如何选择排序算法

实际上，没有绝对优秀的、应该始终采用的排序算法。

书上给出了一些选择不同排序算法的理由，写的非常好，抄录一下。

元素很少：插入排序
几乎有序：插入排序
关注最差情况：堆排序（牢记：堆排序的最差时间复杂度依然是O(nlogn)）
平均较好：快速排序
元素从密集范围取出：桶排序
代码量小：插入排序

书上也在不同应用环境：字符串、浮点、几乎有序等情况下进行了测试，有兴趣的可以去翻阅。[......]

算法技术手册 – 排序 – 桶排序/哈希排序/散列排序

1 Reply

在前面的计数排序中，我们已经领略到了如何用空间换时间的方法，找到一种线性时间复杂度O(N)的排序算法。

计数排序的缺点也是非常明显的：一旦数据范围[0,k)，中的k]相对于数据量N非常稀疏，计数排序的空间会非常大、时间消耗也会增大非常大。当然主要还是空间问题。

个人认为：桶排序 = 哈希排序 = 散列排序，基本思想是一样的。

于是桶排序/哈希排序应运而生，假设值域范围还是k，我们不去创建k个buckets，而是创建m个木桶，让N个元素通过哈系函数映射到这k个桶即可。这里还有一个[......]

算法技术手册 – 排序 – 计数排序

如果已知被排序的n个元素，值范围固定在在 "[0,k)"内]，那么计数排序是最好的选择，它具有线性复杂度。

这个约束有些过强，有些时候，可以将不满足这个条件的转化一下：
比如 [-k, k)映射]到[0, 2k)等]。
再比如1/p的小树映射到p k-p等等。

下面上算法，主要走两遍：
首先建立k个桶
(1)扫描n个元素，增加对应桶中的计数
(2)从小到大扫描k个桶，计数非零则减一，然后顺序、依次输出。

源代码：
#include <stdio.h>[......]

算法技术手册 - 排序 - 堆排序

堆排序依赖于上午写道的构建堆和调整堆。

基本思想：
(1)首先执行BuildHeap（以最大堆为例），则arr[0]已经是最大元素了，如果我们要按照从小到大排序，那么它应该被放在arr[n-1]上，于是，我们swap arr[0]和arr[n-1]。
(2)类似的，我们让i从n-1到0，依次执行调整堆，AdjustHeap(i,n)，每次调整完成后，堆顶部一定是最大元素，正好把他换到i-2上。
上述的思路和选择排序是不是非常相似！

改进：
调整堆实际用到了递归方法，而其实它是[......]