生活明朗,万物可爱,人间值得。
目录
1. 程序的翻译环境和执行环境
1.1翻译环境
1.2 执行环境
2 预处理详解
2.1 预定义符号
2.2 #define
2.3 #undef
2.4 命令行定义
2.5 条件编译
2.6 文件包含
2.6.1 头文件被包含的方式
2.6.2 嵌套文件包含
1. 程序的翻译环境和执行环境
在ANSI C的任何一种实现中,存在两个不同的环境。
第 1 种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。 第 2 种是执行环境,它用于实际执行代码。
1.1翻译环境
翻译环境大致分为四个步骤:预编译(预处理)–> 编译 –> 汇编 –> 链接
接下来我们看各个步骤产生了哪些变化:
1.11 预处理:
预处理 选项 gcc – E test.c – o test.i 预处理完成之后就停下来,预处理之后产生的结果都放在 test.i 文件中。
预处理究竟是处理了哪些东西呢?
- 头文件的包含
- 注释的删除
- #define符号的替换
1.12 编译:
编译 选项 gcc – S test.c 编译完成之后就停下来,结果保存在 test.s 中。
编译又处理了啥呢?
- 如果是C语言代码,就把C语言代码转换成汇编代码
- 进行语法分析,词法分析,语义分析,符号汇总
1.13 汇编:
汇编 选项 gcc – c test.c 汇编完成之后就停下来,结果保存在 test.o 中。
当汇编进行完毕的时候就会产生目标文件(Windows平台下文件后缀名为.obj Linux 平台下文件后缀名为.o
同样汇编又处理了哪些呢?
- 将汇编指令转化成二进制指令
- 形成符号表
1.14 链接:
链接 选项 gcc text.o add.o -o text
每个目标文件由链接器( linker )捆绑在一起,形成一个单一而完整的可执行程序。
链接的处理:
- 合并段表
- 符号表的合并与重定位
由于博主知识掌握不全,所以没法给大家细致讲解每一个步骤究竟是怎样实现的,但是我们还是要掌握 大致的基本框架,这样才能为后面的学习打好基础。
接下来对翻译做个小总结:
- 组成一个程序的每个源文件通过编译过程(包括了预处理,编译,汇编)分别转换成目标代码(object code)。
- 每个目标文件由链接器( linker )捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中
我们经常在程序中看见的 提示:无法解析的外部符号
上述错误产生的原因就是链接时符号表合并 并不能为add函数找到一个有效的地址。
1.2 执行环境
经过链接后程序就成为了可执行程序,这个时候程序在执行环境(运行环境)中执行就会产生代码的结果。
在程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
- 程序的执行便开始。接着便调用 main 函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈 (也就是函数栈帧),存储函数的局部变量和返回 地址。程序同时也可以使用静态( static )内存,存储于静态内中的变量在程序的整个执行过程 一直保留他们的值。
- 终止程序。正常终止 main 函数;也有可能是意外终止。
程序环境就先大致讲到这里,其实翻译环境和运行环境要项深入了解的知识量远不止这些,有兴趣的佬可以自己在《程序员的自我修养中》进行查阅。
2 预处理详解
2.1 预定义符号
__FILE__ //进行编译的源文件__LINE__ //文件当前的行号__DATE__//文件被编译的日期__TIME__//文件被编译的时间__STDC__//如果编译器遵循ANSI C,其值为1,否则未定义
我们可以在VS上试试
另外,__STDC__ VS2022是不支持的。
2.2 #define
2.2.1 #define 定义标识符
语法: #define name stuff
相信这个大家都不陌生,举个栗子:
#define MAX 1000#define reg register //为 register这个关键字,创建一个简短的名字#define do_forever for(;;) //用更形象的符号来替换一种实现#define CASE break;case//在写case语句的时候自动把 break写上。// 如果定义的 stuff过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。#define DEBUG_PRINT printf("file:%s\tline:%d\t \ date:%s\ttime:%s\n" ,\ __FILE__,__LINE__ , \ __DATE__,__TIME__ )
提个问题:在define定义标识符的时候,要不要在最后加上 ; ” />2.2.2 #define 定义宏
#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)。
下面是宏的申明方式:
#define name( parament – list ) stuff 其中的 parament – list 是一个由逗号隔开的符号表,它们可能出现在stuff中。
注意:
- 参数列表的左括号必须与name紧邻。
- 如果两者之间有任何空白存在,参数列表就会被解释为 stuff的一部分。
了解了宏的定义我们不妨来做个题来练练手吧:
大家认为下面的代码输出结果是什么?
#define MAX(x,y) x*y#includeint main(){int a = 10;int b = 20;printf("%d\n", MAX(a, b));printf("%d\n", MAX(a+1, b+1));return 0;}
答案是200,231吗?
为啥结果与我们预期的不符合呀?其实很好理解,当预处理后就变成了
a+1*b+1 由于乘法的优先级大于加法,所以会先算乘法,结果自然是31了
那么究竟该如何避免这种问题?
答案就是+()
这样就没有问题了,那么再问一下,最外面的括号能省略不写吗?
最好还是写上,虽然在本题中这个最外面的括号好像没有啥用,但是在有些情况下会出问题的。
2.2.3 #define 替换规则 在程序中扩展#define定义符号和宏时,需要涉及几个步骤:
- 在调用宏时,首先对参数进行检查,看看是否包含任何由 #define 定义的符号。如果是,它们首先被替换。
- 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
- 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上 述处理过程。
注意:
1. 宏参数和 #define 定义中可以出现其他 #define 定义的符号。但是对于宏,不能出现递归。 2. 当预处理器搜索 #define 定义的符号的时候,字符串常量的内容并不被搜索。
2.2.4 #和##
这两个符号用的比较少,大家可以适当了解一下
# 的作用:如何把参数插入到字符串中?
由于字符串是具有自动连接的特点的,所以我们可以通过上述方式实现;
但是我们想让把一个宏参数变成对应的字符串,应该怎么办呢?
我们可以用#处理:
代码中的 #VALUE 会预处理器处理为:”VALUE” ## 的作用:
##可以把位于它两边的符号合成一个符号。 它允许宏定义从分离的文本片段创建标识符。
注意:
这样的连接必须产生一个合法的标识符。否则其结果就是未定义的。
2.2.5 带副作用的宏参数
我们来看看一个题:
#define MAX(a, b) ( (a) > (b) " />
我们在VS上运行来看看结果:
为什么结果是这样的?
我们把符号替换过去就知道了
(x++)>(y++)" />2.2.6 宏和函数对比宏通常被应用于执行简单的运算,比如在两个数中找出较大值:
#define MAX(a, b) ((a)>(b)?(a):(b))
那为什么不用函数来完成这个任务?
1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。 所以宏比函数在程序的规模和速度方面更胜一筹。 2. 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用来比较的类型。宏是类型无关的。
宏的缺点:当然和函数相比宏也有劣势的地方:
1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。 2. 宏是没法调试的。 3. 宏由于类型无关,也就不够严谨。 4. 宏可能会带来运算符优先级的问题,导致程容易出现错。
宏有时候可以做函数做不到的事情。比如:宏的参数可以出现类型,但是函数做不到:
#define MALLOC(num, type)\ (type *)malloc(num * sizeof(type))...//使用MALLOC(10, int);//类型作为参数//预处理器替换之后:(int *)malloc(10 * sizeof(int));
宏和函数的一个对比 :
属性 #define 定义宏 函数 代 码 长 度 每次使用时,宏代码都会被插入到程中。除了非常小的宏之外,程序的长度会大幅度增长 。 函数代码只出现于一个地方;每次使用这个函数时,都调用那个 地方的同一份代码。 执 行 速 度 更快。 存在函数的调用和返回的额外开销,所以相对慢一些。 操 作 符 优 先 级 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则邻近操作符的优先级可能会产生 不可预料的后果,所以建议宏在书写的时候多些括 号。 函数参数只在函数调用的时候求值一次,它的结果值传递给函 数。表达式的求值结果更容易预测。 带 有 副 作 用 的 参 数 参数可能被替换到宏体中的多个位置,所以带有副作用的参数求值可能会产生不可预料的结果。 函数参数只在传参的时候求值一次,结果更容易控制。 参 数 类 型 宏的参数与类型无关,只要对参数的操作是合法的,它就可以使用于任何参数类型。 函数的参数是与类型有关的,如果参数的类型不同,就需要不同 的函数,即使他们执行的任务是相同的。 调 试 宏是不方便调试的 函数是可以逐语句调试的 递 归 宏是不能递归的 函数是可以递归的 另外,大家可以去看看有关宏的题目:用宏将一个二进制位的奇数位与偶数位交换&&用宏模拟实现offsetof
2.2.7 命名约定
一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者,那我们平时的一个习惯是:
- 把宏名全部大写
- 函数名不要全部大写
2.3 #undef
这条指令用于移除一个宏定义。
#undef NAME//如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。
2.4 命令行定义
许多 C 的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。 例如:当我们根据同一个源文件要编译出一个程序的不同版本的时候,这个特性有点用处。(假定某个程序中声明了一个某个长度的数组,如果机器内存有限,我们需要一个很小的数组,但是另外一个机器 内存大些,我们需要一个数组能够大些。)
#include int main(){int array [ARRAY_SIZE];int i = 0;for(i = 0; i< ARRAY_SIZE; i ++){array[i] = i;}for(i = 0; i< ARRAY_SIZE; i ++){printf("%d " ,array[i]);}printf("\n" );return 0;}
VS2022中不好观察,大家可以在Linux平台下去观察,
命令为:gcc -D ARRAY_SIZE=10 programe.c
2.5 条件编译
在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的。因为我们有条件编译指令。 比如说: 调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译。 我们来举个栗子:
上述代码的意思是:如果已经定义了MAX,那么就打印出hehe,否则就打印出haha,
#ifdef MAX还可以换一种表达: #if defined(MAX)
这种方式只与你是否定义了MAX有关,不关心MAX的值,区别一下下面的代码:
这个的意思是如果1,1为真就执行下面的语句,与我们用的if else 语句有点儿类似。
与此类似:#ifndef MAX == #if !defined(MAX)
小结:
1.#if 常量表达式 //...#endif//常量表达式由预处理器求值。如:#define __DEBUG__ 1#if __DEBUG__ //..#endif2.多个分支的条件编译#if 常量表达式 //...#elif 常量表达式 //...#else //...#endif3.判断是否被定义#if defined(symbol)#ifdef symbol#if !defined(symbol)#ifndef symbol4.嵌套指令#if defined(OS_UNIX) #ifdef OPTION1 unix_version_option1(); #endif #ifdef OPTION2 unix_version_option2(); #endif#elif defined(OS_MSDOS) #ifdef OPTION2 msdos_version_option2(); #endif#endif
那上面的#if( ) 与if有什么区别吗?
#if( ) 在预处理的时候就会被处理,如果( )中值为真,后面表达式就保留,否则直接去掉后面表达式,而if( )后面表达式的值在预处理是不会直接去除的,只会在执行的时候选择性的执行。
2.6 文件包含
我们已经知道, #include 指令可以使另外一个文件被编译,就像它实际出现于 #include 指令的地方一样。 这种替换的方式很简单:预处理器先删除这条指令,并用包含文件的内容替换。这样一个源文件被包含10次,那就实际被编译10次。
2.6.1 头文件被包含的方式
本地文件包含:
#include "filename"
查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标 准位置查找头文件。 如果找不到就提示编译错误。
Linux环境的标准头文件的路径:
/usr/include
VS环境的标准头文件的路径:
C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\include//这是VS2013的默认路径
库文件包含 :
#include
查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。 这样是不是可以说,对于库文件也可以使用 “” 的形式包含? 答案是肯定的, 可以 ,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。
2.6.2 嵌套文件包含
如果出现这样的场景:
如何解决这个问题?
答案:条件编译。
每个头文件的开头写:
#ifndef __TEST_H__#define __TEST_H__//头文件的内容#endif//__TEST_H__
或者:
#pragma once
就可以避免头文件的重复引入。 面试题:
1. 头文件中的 ifndef / define / endif 是干什么用的 " />2. #include < filename . h > 和 #include "filename.h" 有什么区别 ?
回答:
1 防止头文件被重复包含。
2 #include "filename.h" 先去用户的工作目录下去搜索,没有找到再去库函数的标准目录下搜索,还没有找到就报错;而#include 直接去库函数的标准目录下搜索,没有找到就报错。