以下内容整理自互联网,仅用于个人学习
1. 数据结构基本概念
数据结构三要素:
- 数据的逻辑结构:逻辑结构是指数据元素之间的逻辑关系,即从逻辑关系上描述数据。与数据的具体存储无关。数据的逻辑结构分为线性结构和非线性结构,线性表就是典型的线性结构。集合、树和图是典型的非线性结构。
-
数据的存储结构:存储结构是指数据结构在计算机中的表示,也称物理结构。包括数据元素的表示和关系的表示。
数据的存储结构主要有:顺序存储、链式存储、索引存储和散列存储。
- 顺序存储: 把逻辑上相邻的元素存储在物理位置上也相邻的存储单元里,元素之间的关系由存储单元的邻接关系关系来体现。优点是可以实现随机存取,每个元素占用最少的存储空间;缺点是只能使用相邻的一款存储单元,因此可能产生较多的外部碎片。
-
链接存储:不要求逻辑上相邻的元素在物理位置上也相邻, 借助指示元素存储地址的指针表示元素之间的逻辑关系。其优点是不会出现碎片现象,充分利用所有存储单元;缺点是每个元素之间因存储指针而占用额外的空间,并且只能顺序读取。
-
索引存储:在存储元素信息的同时还建立附加的索引表。索引表的每一项称为索引项,索引项的一般形式是:(关键字,地址)。其优点是检索速度快;缺点是增加了附加的索引表,会占用较多的存储空间。另外在增加和删除数据时,要修改索引表,因此会花费较多的时间。
-
散列存储:根据元素的关键字,直接计算出该元素的存储地址,又称Hash存储。其优点是检索、增加和删除节点的操作都很快;缺点是如果散列函数不好,可能出现元素存储单元的冲突,而解决冲突会增加时间。
-
数据的运算:施加在数据上的运算包括运算的定义和实现。运算的定义是针对逻辑结构的,指出运算的功能;运算的实现是针对存储结构的,指出运算的具体操作步骤。
2. 复杂度分析
2.1 算法
算法是对特定问题求解步骤的一种描述,它是指令的有限序列,其中每一条指令表示一个或多个操作。此外,算法还具有下列5个重要特性:
- 有穷性:一个算法必须总是(对于任何合理的输入值)在执行有穷步之后结束,且每一步都可在有穷时间内完成。
- 确定性:算法每一条指令必须有确切的含义,读者理解时不糊产生二义性。即对相同的输入只能得出相同的输出。
- 可行性: 一个算法是可行的,即算法中的描述操作都是可以通过已经实现的基本运算执行有限次来实现。
- 输 入:一个算法有零个或多个输入,这些输入取自于某个特定的对象的集合。
- 输 出:一个算法有一个或多个输出,这些输出是同输入有着某种特定关系的量。
2.2 时间复杂度
将算法中所有语句被重复执行的次数之和记作T(n),时间复杂度主要是分析T(n)的数量级。记作O(f(n))。假设f(n)=an3+bn2+c*n则O(f(n))=O(n^3) 看一个例子,假设需要从数组A[0···n-1]中查找值K位置,算法大致如下:
i=n-1;
while(i>0&&A[i]!=k){
i--;
}
return i;
此算法的复杂度不仅与问题规模n有关,还与输入实例中A的各元素取值以及K的取值有关:
- 如果A中没有与K相等的元素,则第2行代码执行次数为f(n)=n
- 如果A的最后一个元素等于K,则第2行执行的次数为f(n)=0;
- 最坏时间复杂度:是指最坏的情况下,算法的时间复杂度。
- 最好时间复杂度:是指最好的情况下,算法的时间复杂度。
- 平均时间复杂度:是指所有可能输入实例等概率出现的情况下,算法的期望运行时间。
一般总是考虑最坏情况下的时间复杂度,以保证算法的运行时间不会比它更长。 分析算法复杂度时,有以下两条规则:
- 加法规则:O(f(n))+O(g(n))=O(max(f(n),g(n))
- 乘法规则:O(f(n))O(g(n))=O(f(n)g(n))
常见的时间复杂度大小关系:
O(1) < O(log2n)< O(n) < O(nlog2n) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n)
2.3 空间复杂度
空间复杂度为算法所耗费的存储空间,除了存放本身所用的指令、常数、变量和输入数据外,还需要一些对数据进行操作的工作单元和辅助空间,他是问题规模n的函数。 算法原地工作:是指算法所需辅助空间是常量,即O(1)