C语言:预处理详解

前面我们简要概括了一下C语言从编辑编译到链接运行整个过程需要经历的步骤，在这些步骤中预处理（预编译）最为重要，所以我们拿出来进行详细论述。

预定义符号

C语⾔设置了⼀些预定义符号，可以直接使⽤，预定义符号也是在预处理期间处理的。

__FILE__          // 进⾏编译的源⽂件

__LINE__         // ⽂件当前的⾏号

__DATE__          // ⽂件被编译的⽇期

__TIME__          // ⽂件被编译的时间

__STDC__          // 如果编译器遵循 ANSI C ，其值为 1 ，否则未定义

举个栗子：

printf ( "file:%s line:%d\n" , __FILE__, __LINE__);

#define定义常量

基本语法：

# define name stuff

举个例子：

#define MAX 1000
#define reg register //为 register这个关键字，创建⼀个简短的名字
#define do_forever for(;;) //⽤更形象的符号来替换⼀种实现
#define CASE break;case //在写case语句的时候⾃动把 break写上。
// 如果定义的 stuff过⻓，可以分成⼏⾏写，除了最后⼀⾏外，每⾏的后⾯都加⼀个反斜杠(续⾏符)。
#define DEBUG_PRINT printf("file:%s\tline:%d\t \
 date:%s\ttime:%s\n" ,\
 __FILE__,__LINE__ , \
 __DATE__,__TIME__ )

这里我们建议不要去加上（；）分号符，因为我们在用定义的常量时也常常在后面添加分号，如果在宏里定义了分号，就会导致语法错误。例如：

#define MAX 1000;
if(condition)
 max = MAX;
else
 max = 0;

#define定义宏

#define机制包括了一个规定，允许把参数替换到文本中，这种实现通常称为宏（macro）或定义宏（define macro）。下面是宏的定义方式：

# define name( parament-list ) stuff

// 其中的 parament-list 是⼀个由逗号隔开的符号表，它们可能出现在stuff中。

这里要注意：
参数列表的左括号必须与name紧邻，如果两者之间有任何空⽩存在，参数列表就会被解释为stuff的⼀部分。

举个栗子：

#define SQUARE( x ) x * x

这个宏接收⼀个参数 x .如果在上述声明之后，你把 SQUARE( 5 ); 置于程序中，预处理器就会⽤下⾯这个表达式替换上⾯的表达式： 5 * 5。然而如果我们将代码这样写的话会有一定的问题，观察下⾯的代码段：

int a = 5;
printf("%d\n" ,SQUARE( a + 1) );

乍⼀看，你可能觉得这段代码将打印36，事实上它将打印11，为什么呢？替换⽂本时，参数x被替换成a + 1,所以这条语句实际上变成了：

printf ("%d\n",a + 1 * a + 1 );

因此我们需要略微改变一下定义的内容，在宏定义上加上两个括号，这个问题便轻松的解决了：

#define SQUARE(x) (x) * (x)

但还是存在一些问题，这⾥还有⼀个宏定义：

#define DOUBLE(x) (x) + (x)

定义中我们使⽤了括号，想避免之前的问题，但是这个宏可能会出现新的错误。

int a = 5;
printf("%d\n" ,10 * DOUBLE(a));

这将打印什么值呢？看上去，好像打印100，但事实上打印的是55.

printf ("%d\n",10 * (5) + (5));

我们发现替换之后,乘法运算先于宏定义的加法，所以出现了 55 .所以我们需要进一步去修改：

#define DOUBLE(x)  ((x)+(x))

建议：所有⽤于对数值表达式进⾏求值的宏定义都应该⽤这种⽅式加上括号，避免在使⽤宏时由于参数中的操作符或邻近操作符之间不可预料的相互作⽤。

带有副作⽤的宏参数

当宏参数在宏的定义中出现超过一次的时候，如果参数带有副作用，那么你在使用这个宏的时候就可能出现危险，导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。例如：

x+ 1 ; // 不带副作⽤

x++; // 带有副作⽤

MAX宏可以证明具有副作用的参数所引起的问题。

#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
...
x = 5;
y = 8;
z = MAX(x++, y++);
printf("x=%d y=%d z=%d\n", x, y, z);
//输出的结果是什么？

将宏定义带入z的表达式中后，我们得到：

z = ( (x++) > (y++) ? (x++) : (y++));

所以输出的结果是：x=6， y=10， z=9

宏定义的规则

在程序中扩展#define 定义符号和宏时，需要涉及几个步骤。

1、在调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果有，则首先将它们替换。

2、替换文本随后被插入到程序中原来的文本位置。对于宏，参数名被他们的值所替换。

3、最后，再次对结果文件进行扫描，看看它是否包含任何有#define定义的符号。如果时，就重复上述处理过程。

注意：

1、宏参数和#define定义中可以出现其他#define定义的符号。但是对于宏，不能出现递归。

2、当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被搜索。也就是说在字符串中如果存在和#define定义的常量和宏并不会被替换。

宏函数的对比

宏通常被应用于简单的运算。比如在两个数中找出较大的一个数时，写成宏会更有优势一些。

#define MAX(X,Y)  ((X)>(Y)?(X):(Y))

有很多人会想到，我们之前用函数也可以轻松实现上面的任务啊，为什么还要使用宏去完成呢？

原因有二（宏的优势）：

1、用于调用函数和从函数返回代码可能比实际执行这个小型计算工作所需要的实践更多。所以宏比函数在程序的规模和速度方面更盛一筹。

2、更为重要的是函数的参数必须为特定的类型。所以函数只能在类型适合的表达式上使用。反之宏可以适用于整型、长整型、浮点型等可以用于>来比较的类型。宏的参数是类型无关的。

和函数相比宏的劣势：

1、每次使用宏的时候，一份宏定义的代码将插入到程序中。除非比较短，否则可能大幅度增加程序的长度。

2、宏是没法调试的。

3、宏由于与类型无关，也就不够严谨。

4、宏可能会带来运算符优先级的问题，导致程序容易出现错误。

对比完优劣后，我们还要知道宏有时候可以做函数做不到的事情。比如：宏的参数是可以出现类型的，但是函数做不到。

#define MALLOC(num, type)\
 (type )malloc(num sizeof(type))
 ...
//使⽤
 MALLOC(10, int);//类型作为参数
//预处理器替换之后：
 (int *)malloc(10 sizeof(int));

总结宏和函数的对比：

#和##

#运算符

#运算符把宏的一个参数转换为字符串字面量。它仅允许出现在带参数的宏的替换列表中。

#运算符所执行的操作可以理解为“字符串化”。

当我们有一个变量 int a = 10；的时候，我们想打印出：the value of a is 10.就可以写成：

#define PRINT(n) printf("the value of"#n"is %d", n)

当我们按照下面的方式调用的时候：

PRINT(a); //当我们把a替换到宏的体内是。就出现了#a，而#a就是转换为字符串"a",这时字符串代码就会被预处理为：

printf("the value of ""a" " is %d", a);

而相邻字符串是可以合并的，所以结果就是：

the value of a is 10

##运算符

##可以把位于它两边的符号合成一个符号，它允许宏定义从分离的文本片段创建标识符。因此##也被称为记号粘合符。这样的连接必须产生一个合法的标识符，否则其结果就是未定义的。

这⾥我们想写⼀个函数求2个数的较⼤值的时候，不同的数据类型就得写不同的函数。

比如：

int int_max(int x, int y)
{
 return x>y?x:y;
}
float float_max(float x, float y)
{
 return x>yx:y;
}

但是这样写起来太繁琐了，现在我们这样写代码试试：

#define GENERIC_MAX(type)  \
type type##_MAX(type x, type y)\
{                     \
   return (x>y?x:y);  \
}

这样我们就可以使用宏来定义不同函数

#include<stdio.h>

#define GENERIC_MAX(type)  \
type type##_MAX(type x, type y)\
{                     \
   return (x>y?x:y);  \
}

GENERIC_MAX(int) //替换到宏体内后int##_max ⽣成了新的符号 int_max做函数名
GENERIC_MAX(float) //替换到宏体内后float##_max ⽣成了新的符号 float_max做函数名
int main()
{
 //调⽤函数
 int m = int_max(2, 3);
 printf("%d\n", m);
 float fm = float_max(3.5f, 4.5f);
 printf("%f\n", fm);
 return 0;
}

结果：

3

4.500000

在实际开发过程中##使⽤的很少，很难取出⾮常贴切的例⼦，因此不过多研究。

命名约定

⼀般来讲函数的宏的使⽤语法很相似。所以语⾔本⾝没法帮我们区分⼆者。那我们平时的⼀个习惯是：把宏名全部⼤写，函数名不要全部⼤写。

#undef

这条指令⽤于移除⼀个宏定义。 如果现存的⼀个名字需要被重新定义，那么它的旧名字⾸先要被移除。

# undef NAME

命令行定义

许多C语言的编译器提供了一种能力,允许在命令行中定义符号用于启动编译过程。例如：当我们根据同一个源文件要编译出一个程序的不同版本的时候，这个特性有点用处。（假定某个程序中声明了一个某长度的数组，如果机器内存有限，我们需要一个很小的数组，但是另外一个很小的数组，但是另外一个机器内存大些，我们需要一个数组能够大些）。

#include <stdio.h>
int main()
{
 int array [ARRAY_SIZE];
 int i = 0;
 for(i = 0; i< ARRAY_SIZE; i ++)
 {
 array[i] = i;
 }
 for(i = 0; i< ARRAY_SIZE; i ++)
 {
 printf("%d " ,array[i]);
 }
 printf("\n" );
 return 0;
}

编译指令：

//linux 环境演⽰

gcc -D ARRAY_SIZE= 10 programe.c

条件编译

在编译一个程序的时候我们如果要将一条语句（一组语句）编译或者放弃编译（注释）是很方便的。因为我们有条件编译指令。

比如：调试性的代码，删除可惜，保留⼜碍事，所以我们可以选择性的编译。

#include <stdio.h>
#define __DEBUG__
int main()
{
 int i = 0;
 int arr[10] = {0};
 for(i=0; i<10; i++)
 {
     arr[i] = i;
     #ifdef __DEBUG__
     printf("%d\n", arr[i]);//为了观察数组是否赋值成功。 
     #endif //__DEBUG__
 }
 return 0;
}

下面是常见的条件编译指令：

1.
#if 常量表达式
 //...
#endif
//常量表达式由预处理器求值。
如：
#define __DEBUG__ 1
#if __DEBUG__
 //..
#endif
2.多个分⽀的条件编译
#if 常量表达式
 //...
#elif 常量表达式
 //...
#else
 //...
#endif
3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
4.嵌套指令
#if defined(OS_UNIX)
 #ifdef OPTION1
 unix_version_option1();
 #endif
 #ifdef OPTION2
 unix_version_option2();
 #endif
#elif defined(OS_MSDOS)
 #ifdef OPTION2
 msdos_version_option2();
 #endif
#endif