用C编写的程序被存储在文本文件中,该文件就被称之为源文件(source code file)。比如如下的代码
#include int main() { printf("hello world"); getchar();return 1;}
源码编译
计算机CPU的母语是机器语言,用C语言编写的代码CPU不能识别运行。这就好比中国人的母语是汉语,而美国人的母语是英语。中国人使用汉语和美国人交流,美国人听不懂,反过来也是一样的。我们要和对方进行交流,就需要有个中间人做翻译,将汉语翻译成英语和美国人进行交流。
同样的道理,我们和CPU交流,让CPU给我们干活执行任务,需要用CPU能听懂的语言和其交流。所以呢C语言在运行之前首选需要进行编译。编译就像是一个翻译,将C语言翻译成CPU能听懂的机器语言。编译就是把C语言转换为机器语言。类似于翻译
使用gcc编译器将hello.c 编译成二进制文件hello.obj
使用gcc编译器将hello.c 编译成二进制文件hello.obj
gcc -c hello.c -o hello.obj
编译后的文件如下图所示:
编译后生成的hello.obj文件,目前还是不能运行的。因为目前只是把我们上边的源代码编译成了二进制文件。我们的源代码并不是完整的可执行文件。
首先,我们源文件中调用了库函数中的printf,我们的源代码中并没有这个函数的源代码,printf函数的代码存放在库文件中。
其次,我们的源文件中还缺少启动代码。启动代码充当程序和操作系统的接口。
所以编译生成的obj文件,我们称之为中间文件。中间文件需要运行,就需要把程序用到的所有代码都包含进来,这个过程就叫做链接。
链接
链接的作用就是把源文件,系统标准的启动代码,程序中用到的库函数代码这三部分合并成一个文件,该文件就是可执行文件。连接器只会把程序中用到的库函数的代码包含进来。
我们将上边编译生成的文件进行链接:
gcc hello.obj -o hello
链接之后如下图所示:
可以看到链接之后的可执行文件文件大小53kb,明显比我们的源文件,和中间文件大了很多,这时候的可执行文件,鼠标双击即可执行。
链接又可以分成静态链接和动态链接这两种
静态链接
假如有程序A和B,在运行时候都会用到函数MyFunc,那么在程序链接的时候各自拷贝了一份函数MyFunc的代码到各自可执行文件中,程序A、B并行运行过程中,内存中存储了两份函数Myfunc的代码,这种链接方式就是静态链接
动态链接(Dynamic Link Library)
假如将MyFunc做成一个DLL文件,在程序A、B运行的过程中在去动态的链接该文件,就称之为动态链接文件
程序的可移植性
机器语言
不同的CPU硬件平台的指令集不同的,在没有高级语言的时代,人们直接使用机器指令来编程。比如使用x86平台的机器指令集进行编程,那机器指令就只能在x86平台运行。在其他的CPU平台比如MIPS,ARM等上边运行不了的,同样的MIPS的机器指令集在x86平台也是运行不了的
汇编语言
由于直接使用机器指令集,对人类来说,不太友好。人们后面就开始使用助记符来代替机器指令,在运行的时候由汇编器编译成机器指令运行。但是呢,助记符和机器指令是一一对应的,仍然不具有可移植性
高级语言
现代的高级语言比如C,运行的时候需要由编译器进行编译的。对于程序员来说,可以不用关注底层的机器指令,只需要熟悉高级语言相应的语法就可以了。按照C语言的语法写的代码,不用做大的改动就可以在多个平台运行。比如要在X86平台运行,那x86平台的C编译器会将C语言编译成x86平台的机器指令,在MIPS平台运行,那么MIPS平台的C编译器会将c代码编译为MIPS平台的机器指令。