数据结构与算法——算法

    • 什么是算法?
      • 算法的特征(特性)
    • 算法的设计(要点)
    • 算法效率的度量
      • 事后统计法
      • 事前分析估算法
        • 时间复杂度
        • 空间复杂度
    • 总结

什么是算法?

程序 = 数据结构 + 算法

算法(algorithm)是对特定问题求解的步骤的一种具体描述,算法是指令的有有限序列,其中每一条指令表示一个或是多个操作,用于解决某个问题


算法的特征(特性)

  • 有穷性——一个算法必须总是(对任何合法的输入值)在执行有穷步之后结束,且每一步都可在有穷时间内完成(算法必须是又穷的,而程序是无穷的,简单理解就是用有限个步骤解决某个特定的问题)
  • 确定性——算法中每一条指令必须有确切的含义,使用者理解时不会产生二义性。并且,在任何条件下,算法只有唯一的一条执行路径,即对于相同的输入只能得出相同的输出
  • 可行性——一个算法是能行的,即算法中描述的操作都是可以通过已经实现的基本运算执行有限次来实现的
  • 输入——一个算法有零个或多个输入,这些输入取自与某个特定的对象的集合
  • 输出——一个算法有一个或多个的输出,这些输出是同输入有着某些特定关系的量

算法的设计(要点)

通常一个好的算法有以下要求:

1.正确性,算法应该能够正确地解决求解问题

2.可读性,算法主要是为了让人阅读和交流,其次才是机器执行。可读性好有助于人对算法的理解;晦涩难懂的程序易于隐藏较多的错误,难以调试和修改。

3.健壮性,当输入非法时,算法也能适当地做出反应或进行处理,而不会产生莫名其妙的输出结果

4.高效率与低存储量需求,效率指的是算法执行的时间,对于同一个问题如果有多个算法可以解决,执行时间短的算法效率高。存储量需求指算法执行过程中所需要的最大存储空间。效率与低存储量需求这两者都与问题的规模有关

注:算法是可以用伪代码描述


算法效率的度量

算法执行的时间需要通过依据该算法编制的程序在计算机上运行时所消耗的时间来度量。度量一个程序的执行时间通常有两种方法

事后统计法

因为很多计算机内部都有计时功能,有的甚至可精确到毫秒级,不同算法的程序可通过一组或若干组相同的统计数据以分辨优劣,但这种方法有两个缺陷:一个是必须先运行依据算法编制的程序;另一个是所得时间的统计量依赖于计算机的硬件、软件等环境因素,有时容易掩盖算法本身的优劣

事前分析估算法

一个用高级程序语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:

  • 依据的算法选用何种策略
  • 问题的规模
  • 书写程序的语言,对于同一个算法,实现语言的级别越高,执行效率就越低
  • 编译程序所产生的机器代码的质量
  • 机器执行指令的速度

所以说,同一个算法用不同的语言实现,或者用不同的编译程序进行编译,或者在不 同计算机上运行时,效率均不相同。

一个算法是由 控制结构(顺序、分支和循环三种)和原操作(指固有的数据类型的操作) 构成的,则算法时间取决于两者的综合效果。为了便于比较同一问题的不同算法,通常做法是,从算法中选取一种对于研究的问题(或是算法类型)来说是基本操作的原操作,以该基本操作重复执行的次数作为算法的时间量度

时间复杂度

一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数f(n),算法的时间度量记作:

T ( n ) = O ( f ( n ) )T(n) = O(f(n))T(n)=O(f(n))

它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称为时间复杂度

所以说,被称为问题的基本操作的元操作应是其重复执行次数和算法的执行时间成正比的原操作,多数情况下它是最深层循环内的语句中的原操作。它的执行次数和包含语句的频度相同。

注:语句的频度指的是该语句重复执行的次数

根据输入数据的特点,时间复杂度具有最差平均最佳三种情况,一般我们考虑的时间复杂度都是最坏的那种情况,最坏时间复杂度是包含于最好、和平均两种情况的。

常见种类:

根据从大到小,常见的算法时间复杂度主要有:

O ( 1 ) < O ( l o g ₂ n ) < O ( n ) < O ( n l o g ₂ n ) < O ( n ² ) < O ( n ³ ) < O ( 2 ⁿ ) < O ( n ! ) < O ( n ⁿ )O(1)<O(log₂n)<O(n)<O(nlog₂n)<O(n²)<O(n³)<O(2ⁿ)<O(n!)<O(nⁿ)O(1)<O(logn)<O(n)<O(nlogn)<O(n²)<O(n³)<O(2)<O(n!)<O(n)

实例一:

void speaker(int n){int i = 1;while(i<=n){i = i* 2; //每次翻倍printf("我真的会谢 %d\n", i);}printf("我是真的栓Q %d\n", n);}

时间复杂度:

T ( n ) = O ( x ) = O ( l o g ₂ n )T(n) = O(x) = O(log₂n)T(n)=O(x)=O(logn)

实例二:

void speaker(int flag[], int n){//n为问题规模printf("你今天好吗? \n");for(int i=0; i<n; i++){ //从第一个元素查找if(flag[i]==n){ //找到元素nprintf("我很好 %d\n", n);break;}}}//flag数组中乱序存放了1~n这些数int flag[n] = {1.......n};speaker(flag, n)

时间复杂度:

  • 最好情况:元素n在第一个位置(T(n) = O(1))
  • 最坏情况:元素n在最后一个位置(T(n) = O(n))
  • 平均情况:假设元素n在任意一个位置的概率相同为1/n(T(n) = O(n))

由于算法的时间复杂度考虑的只是对于问题规模n的增长率,则在难以精确计算基本操作执行次数(或语句频度)的情况下,只需求出它关于n的增长率或阶即可

空间复杂度

类似于算法的时间复杂度,我们还需要掌握的是算法的空间复杂度,其中n为问题的规模(或大小)

S ( n ) = O ( f ( n ) )S(n) = O(f(n))S(n)=O(f(n))

空间复杂度涉及的空间类型有:

  • 输入空间: 存储输入数据所需的空间大小;
  • 暂存空间: 算法运行过程中,存储所有中间变量和对象等数据所需的空间大小;
  • 输出空间: 算法运行返回时,存储输出数据所需的空间大小;

总结

以上就是对数据结构与算法中算法的一些介绍和理论知识,算法的时间复杂度和空间复杂度是评判一个程序设计是否高效合理的一种方式,在往后的数据结构中,对数据的操作都要考虑到该算法的时间复杂度和空间复杂度。

觉得不错的话记得点赞收藏呀!!

别忘了给我关注~~