4. 局部变量与全局变量

我们把函数中定义的变量称为局部变量(Local Variable),由于形参相当于函数中定义的变量,所以形参也相当于局部变量。在这里“局部”有两个含义:

1、某个函数中定义的变量不能被另一个函数使用。例如print_time中的hourminute在main函数中没有定义,不能使用,同样main函数中的局部变量也不能被print_time函数使用。如果这样定义:

void print_time(int hour, int minute)
{
	printf("%d:%d\n", hour, minute);
}

int main(void)
{
	int hour = 23, minute = 59;
	print_time(hour, minute);
	return 0;
}

main函数中定义了局部变量hourprint_time函数中也有参数hour,虽然它们名称相同,但仍然是不同的变量,仍然代表不同的存储空间,只不过各自的存储空间中存了相同的值23。main函数的局部变量minuteprint_time函数的参数minute也是如此。

2、每次调用函数时局部变量都表示不同的存储空间。局部变量是在每次函数调用时分配存储空间,每次函数返回时释放存储空间的,例如调用print_time(23, 59)时,分配hourminute两个变量的存储空间,在里面分别存上23和59,函数返回时释放它们的存储空间,下次再调用print_time(12, 20)时,又分配hourminute两个变量的存储空间,在里面分别存上12和20。

我们知道,函数体可以由很多条语句组成,现在学过的有变量定义语句和表达式语句。在函数体中,通常把所有的变量定义语句放在最前面,然后才是其它语句,这是传统C的规定,我们之前举的所有例子都遵守这一规定。C99允许变量定义穿插在其它语句之中,只要对于每个变量都遵循先定义后使用的原则就可以,不管怎么样,使用传统C的特性总是比较保险的。

与局部变量的概念相对的是全局变量(Global Variable),全局变量定义在所有的函数体之外,它们在整个程序开始之前分配存储空间,在程序结束时释放存储空间,所有函数都可以通过全局变量名访问它们,例如:

例 3.5. 全局变量

#include <stdio.h>

int hour = 23, minute = 59;

void print_time(void)
{
	printf("%d:%d in print_time\n", hour, minute);
}

int main(void)
{
	print_time();
	printf("%d:%d in main\n", hour, minute);
	return 0;
}

全局变量在整个程序的所有函数中都可以访问,所以在整个程序运行过程中全局变量被读写的顺序从源代码中看不出来(源代码的书写顺序并不能反映函数的调用顺序),出现了Bug往往就是因为在某个不起眼的地方对全局变量的读写顺序不正确,如果代码规模很大,这种错误是很难找出来的。另一方面,对于局部变量的访问不仅局限在一个函数内部,而且局限在一次函数调用之中,从函数的源代码也很容易看出访问的先后顺序是怎样的,所以比较容易找到Bug。因此,虽然全局变量用起来很方便,但一定要慎用,能用函数传参代替的就不要用全局变量

如果全局变量和局部变量重名了会怎么样呢?如果上面的例子改为:

例 3.6. 作用域


则第一次调用print_time打印的是全局变量的值,第二次直接调用printf打印的则是main函数的局部变量的值。在C语言中,每个标识符都有特定的作用域(Scope),全局变量是定义在所有函数体之外的标识符,它的作用域从定义的位置开始直到源文件结束,而main函数局部变量的作用域仅限于main函数之中。如上图所示,设想整个源文件是一张大纸,也就是全局变量的作用域,而main函数是贴在这张大纸上的一张小纸,也就是main函数局部变量的作用域。在小纸上用到标识符hourminute时应该参考小纸上的定义,因为大纸(全局变量的作用域)被盖住了,如果在小纸上用到某个标识符却没有找到它的定义,那么再去翻看下面的大纸,例如上图中的变量x。

到目前为止我们在初始化一个变量时都是用常量做Initializer,其实也可以用表达式做Initializer,但要注意一点:局部变量可以用任意类型相符的表达式来初始化,而全局变量只能用常量表达式初始化。例如,全局变量pi这样初始化是合法的:

double pi = 3.14 + 0.0016;

但这样初始化是不合法的:

double pi = acos(-1.0);

然而局部变量这样初始化却是可以的。全局变量的初始值要求保存在编译生成的目标代码中,所以必须在编译时就能计算出来,然而上面第二种Initializer的值必须在生成了目标代码之后在运行时调用acos函数才能知道,所以不能用来初始化全局变量。请注意区分编译时和运行时的概念。为了方便编译器实现这一限制,C语言从语法上规定了全局变量只能用常量表达式来初始化,因此下面这种全局变量初始化也是不合法的:

int minute = 360;
int hour = minute / 60;

虽然在编译时也可以计算出hour的初始值,但minute / 60不是常量表达式,不符合语法规定。

如果全局变量在定义时不初始化,则初始值是0,也就是说,整型的就是0,字符型的就是'\0',浮点型的就是0.0。如果局部变量在定义时不初始化,则初始值是不确定的,所以,局部变量在使用前一定要先赋值,不管是通过初始化还是赋值运算符,如果读取一个不确定的值来使用肯定会引入Bug。至于为什么这样规定,以后会讲到的。

如何证明“局部变量的存储空间在每次函数调用时分配,在函数返回时释放”?当我们想要确认某些语法规则时,可以查教材,也可以查C99,但最快捷的办法就是编个小程序验证一下:

例 3.7. 验证局部变量存储空间的分配和释放

#include <stdio.h>

int foo(void)
{
	int i;
	printf("%d\n", i);
	i = 777;
}

int main(void)
{
	foo();
	foo();
	return 0;
}

第一次调用foo函数,分配变量i的存储空间,然后打印i的值,由于i未初始化,打出来应该是一个不确定的值,然后把i赋值为777,函数返回,释放i的存储空间。第二次调用foo函数,分配变量i的存储空间,然后打印i的值,由于i未初始化,如果打出来的又是一个不确定的值,就证明了“局部变量的存储空间在每次函数调用时分配,在函数返回时释放”。分析完了,我们运行程序看看是不是像我们分析的这样:

134518128
777

结果出乎我们意料,第二次调用打出来的i值正是第一次调用末尾给i赋的值777。有一种初学者是这样,原本就没有把这条语法规则记牢,或者对自己的记忆力没信心,看到这个结果就会想:哦那肯定是我记错了,改过来记吧,应该是“函数中的局部变量具有一直存在的固定的存储空间,每次函数调用时使用它,返回时也不释放,再次调用函数时它应该还能保持上次的值”。还有一种初学者是怀疑论者或不可知论者,看到这个结果就会想:教材上明明说“局部变量的存储空间在每次函数调用时分配,在函数返回时释放”,那一定是教材写错了,教材也是人写的,是人写的就难免出错,哦,连C99也这么写的啊,C99也是人写的,也难免出错,或者C99也许没错,但是反正运行结果就是错了,计算机这东西真靠不住,太容易受电磁干扰和宇宙射线影响了,我的程序写得再正确也有可能被干扰得不能正确运行。

这是初学者最常见的两种心态。不从客观事实和逻辑推理出发分析问题的真正原因,而仅凭主观臆断胡乱给问题定性,“说你有罪你就有罪”。先不要胡乱怀疑,我们再做一次实验,在两个foo调用之间插一个别的调用,结果就大不相同了:

int main(void)
{
	foo();
	printf("hello\n");
	foo();
	return 0;
}

结果是:

134518200
hello
0

这一回,第二次调用foo打出来的i值又不是777了而是0,“局部变量的存储空间在每次函数调用时分配,在函数返回时释放”这个结论似乎对了,但另一个结论又不对了:全局变量不初始化才是0啊,不是说“局部变量不初始化则初值不确定”吗?

关键的一点是,我说“初值不确定”,有没有说这个不确定值不能是0?有没有说这个不确定值不能是上次调用赋的值?在这里“不确定”的准确含义是:每次调用这个函数时局部变量的初值可能不一样,运行环境不同,函数的调用次序不同,都会影响到局部变量的初值。在运用逻辑推理时一定要注意,不要把必要条件(Necessary Condition)当充分条件(Sufficient Condition),这一点在Debug时尤其重要,看到错误现象不要轻易断定原因是什么,一定要考虑再三,找出它的真正原因。例如,不要看到第二次调用打印出777就断定“函数中的局部变量具有一直存在的固定的存储空间,每次函数调用时使用它,返回时也不释放,再次调用函数时它应该还能保持上次的值”,777这个结果是结论的必要条件,但不充分。也不要看到第二次调用打印出0就断定“局部变量未初始化则初值为0”,0这个结果是结论的必要条件,但不充分。至于为什么会有这样的现象,这个不确定值刚好是777,刚好是0,以后我们再分析。