前言

什么是初始化?为什么要初始化?静态变量和局部变量的初始化又有什么区别?实际应用中应该怎么做?本文将一一回答这些问题。

什么是初始化

初始化指的是对数据对象或者变量赋予初始值。例如:

int value = 8; //声明整型变量并初始化为8
int arr[] = {1,2,3}; //声明整型数组arr,并初始化其值为1,2,3

为什么要初始化

我们来看一个示例程序。
test0.c程序清单如下:

#include <stdio.h>
#include <stdlib.h>
int main(void)
{
    int sum;
    int randNum;
    while(10 > sum)
    {
        randNum =  rand() % 10;         sum += randNum;
        printf("rand num is %d,sum is %d\n",randNum,sum);
    }
    printf("the final sum is %d\n",sum);
    return 0;
}

程序随机产生0到9的数字,使得sum的值大于或等于10时,退出程序。
编译并运行:

gcc  -o test0 test0.c
./test0

运行结果如下(每次运行结果可能不同):

rand num is 3,sum is -4040865
rand num is 6,sum is -4040859
rand num is 7,sum is -4040852
rand num is 5,sum is -4040847
rand num is 3,sum is -4040844
rand num is 5,sum is -4040839
(省略其他内容)

从运行结果来看,程序并没有达到我们的预期,这是为什么呢?

很多读者可能已经知道,问题在于声明sum之后,没有为其赋初始值,在这样的情况下,sum的值是随机的,因此在一开始sum可能是一个很小的负数,导致多次循环出现。很显然,初始化避免使用了变量的“脏值”。而将sum的声明改成如下定义即可:

int sum = 0;

如果将sum声明为静态变量,情况又会如何呢?

//test1.c
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
    static int sum;
    int randNum;
    while(10 > sum)
    {
        randNum =  rand() % 10;         sum += randNum;
        printf("rand num is %d,sum is %d\n",randNum,sum);
    }
    printf("the final sum is %d\n",sum);
    return 0;
}

编译并运行:

rand num is 3,sum is 3
rand num is 6,sum is 9
rand num is 7,sum is 16
the final sum is 16

在这种情况下,程序是能够符合我们预期的结果,这又是为什么呢?原因在于静态变量会被默认初始化。例如,int类型会被初始化为0。那么问题来了:

  • 为什么局部变量未初始化的时候的值是“脏值”?

  • 静态变量和局部变量为什么又不一样呢?

在解答上面这两个问题之前,我们需要简单了解一下程序的存储空间布局。

程序的存储空间布局

C程序主要由以下几部分组成:

  • 正文段。即机器指令部分,为防止意外被修改,设为只读。

  • 初始化数据段。它包含了程序中需要明确赋初值的静态变量。

  • 未初始化数据段。它包含了程序中未赋初值的或初始化为0的静态变量,在程序开始执行之前,内核将此段中的数据初始化为0。

  • 栈。它保存了自动(局部)变量以及函数调用所要的信息。

  • 堆。用于动态内存分配。例如使用malloc函数进行内存分配。

其中,正文段和数据段的内容是“静态”的,因为在程序被编译出来之后,在整个程序地址就确定了,而堆栈中的内容是”动态”变化的,它随着进行的运行而不断变化着,再加上栈随机化的策略,使得程序每次运行时,栈的地址也是不确定的。

局部变量和静态变量的初始化有何不同

有了前面的铺垫,就很好理解两者的差别了。
未初始化的局部变量位于栈中,它的位置是不确定的,因此其值也是不确定的。当然,在windows下它的值是0xcccccccc,而“烫”字在MBCS字符集中的值为0xcccccccc,你说巧不巧?

而静态变量就不一样的,它的地址是确定的,并且存放在了数据段,而程序在运行之前,未初始化数据段的内容可以很方便地统一被初始化为0。这也就解释了前面的两个示例程序的结果为什么会不一样。我们加上一些打印,来看一看是否真的如此?

//test2.c
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
    static int sum;
    int randNum;
    while(10 > sum)
    {
        randNum =  rand() % 10;         sum += randNum;
        printf("rand num is %d,sum is %d\n",randNum,sum);
    }
    printf("the final sum is %d\n",sum);
    printf("sum addr %p,randNum addr %p\n",&sum,&randNum);
    return 0;
}

编译并运行:

gcc -o test2 test2.c

运行结果1:

rand num is 3,sum is 3
rand num is 6,sum is 9
rand num is 7,sum is 16
the final sum is 16
sum addr 0x60104c,randNum addr 0x7ffd0ea8cf54

运行结果2:

rand num is 3,sum is 3
rand num is 6,sum is 9
rand num is 7,sum is 16
the final sum is 16
sum addr 0x60104c,randNum addr 0x7ffff5e3ddb4

在这里,sum是静态局部变量,而randNun是局部变量(自动变量),因此可以发现,sum的地址值总是不变的,而randNum的值却不断变化着。我们也可以通过nm命令查看sum的地址:

nm test2 |grep sum
000000000060104c b sum.2805

总结

我们来总结一下本文的主要内容:

  • 如果变量是静态的,它会被初始化为0;如果变量是自动的,它不会被初始化。

  • 静态的变量包括全局变量、静态全局变量、静态局部变量。

  • 使用局部变量之前对其进行初始化,避免使用“脏值”。

  • 从可读性考虑,静态变量也建议显示初始化。

  • 初始化为0的静态变量仍然存在未初始化数据段中(BSS段)。

送几句熟悉的话给大家:

手持两把锟斤拷,
口中疾呼烫烫烫。
脚踏千朵屯屯屯,
笑看万物锘锘锘。

思考

test1.c的代码运行结果每次都一样吗?为什么?该如何修改才能使得每次的运行结果不一样?

栈随机化的作用是什么?

推荐阅读:

C语言入坑指南-数组之谜

一个命令帮你对文本排序

如何理解 Linux shell中“2>&1”?

推荐一款强大的在线编译器

Linux常用命令--系统状态篇

关注公众号【编程珠玑】,第一时间获取更多原创技术文章

C语言入坑指南-被遗忘的初始化的更多相关文章

  1. C语言入坑指南-缓冲区溢出

    前言 缓冲区溢出通常指的是向缓冲区写入了超过缓冲区所能保存的最大数据量的数据.如果说之前所提到的一些问题可能只是影响部分功能的实现,那么缓冲区溢出将可能会造成程序运行终止,被不安全代码攻击等严重问题, ...

  2. C语言入坑指南-数组之谜

    前言 在C语言中,数组和指针似乎总是"暧昧不清",有时候很容易把它们混淆.本文就来理一理数组和指针之间到底有哪些异同. 数组回顾 在分析之前,我们不妨回顾一下数组的知识.数组是可以 ...

  3. ElasticSearch入坑指南之概述及安装

    ---恢复内容开始--- ElasticSearch入坑指南之概述及安装 了解ElasticSearch ElasticSearch(简称ES)基于Lucene的分布式全文检索引擎.使用ES可以实现近 ...

  4. Rust入坑指南:核心概念

    如果说前面的坑我们一直在用小铲子挖的话,那么今天的坑就是用挖掘机挖的. 今天要介绍的是Rust的一个核心概念:Ownership.全文将分为什么是Ownership以及Ownership的传递类型两部 ...

  5. Rust入坑指南:鳞次栉比

    很久没有挖Rust的坑啦,今天来挖一些排列整齐的坑.没错,就是要介绍一些集合类型的数据类型."鳞次栉比"这个标题是不是显得很有文化? 在Rust入坑指南:常规套路一文中我们已经介绍 ...

  6. Rust入坑指南:齐头并进(上)

    我们知道,如今CPU的计算能力已经非常强大,其速度比内存要高出许多个数量级.为了充分利用CPU资源,多数编程语言都提供了并发编程的能力,Rust也不例外. 聊到并发,就离不开多进程和多线程这两个概念. ...

  7. electron入坑指南

    electron入坑指南 简介 electron 实际集成chrome浏览器和node环境, 运行你写的网页 app 基本目录结构 index.html 名称可以不是index, 这个文件与普通网页的 ...

  8. Elasticsearch入坑指南之RESTful API

    Elasticsearch入坑指南之RESTful API Tags:Elasticsearch ES为开发者提供了非常丰富的基于Http协议的Rest API,通过简单的Rest请求,就可以实现非常 ...

  9. eclipse中导入外部包却无法查看对应源码或Javadoc的入坑指南

    eclipse中导入外部包却无法查看对应源码或Javadoc的 入坑指南 出现这个错误的原因是,你虽然导入了.jar包,但没有配置对应的Javadoc或源码路径,所以在编辑器中无法查看源 码和对应AP ...

随机推荐

  1. LeetCode-两个结构分别遍历,然后合并

    今天做了leetcode67题,两个2进制数相加,回想了一下其实有很多这种类型的题,比如leetcode2两数相加. 在做这种题时我自己的思路就是先循环遍历一个短的,然后跳出循环,判断是哪个结束,再接 ...

  2. 深度解析XML的结构与类映射

    XML概述      可扩展标记语言 (Extensible Markup Language, XML) ,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据.定义数据类型,是一种允许用户对自 ...

  3. 数据库 'xxxx' 的事务日志已满。若要查明无法重用日志中的空间的原因

    一.出现的背景: 在SQL server中执行SQL语句出现如下图: 二.出现的原因: 我到数据库的服务器看了一下硬盘空间发现此数据库所在的D盘空间几乎已经用尽.如图: 三.解决方法: 第一种方法:直 ...

  4. [angularjs] angularjs系列笔记(三)模型

    ng-model指令 ng-model可以将输入域的值与AngularJs的变量绑定 双向绑定 当修改输入域的值时候,AngularJs属性的值也将修改 <div ng-app="Ho ...

  5. 处理JavaScript异常的正确姿势

    译者按: 错误是无法避免的,妥善处理它才是最重要的! 原文: A Guide to Proper Error Handling in JavaScript Related Topics: 译者: Fu ...

  6. sqlplus导入数据

    从sqlplus命令行中向数据库中导入数据:

  7. 2018-08-06 在Office的VBA代码里中文命名

    在Excel处理数据时, 顺便试了一下VBA代码编辑器里输入中文, 结果显示为乱码. 查了一下发现VBA本身支持Unicode, 但需要设置系统配置使编辑器能够正常显示, 即设置简体中文为Curren ...

  8. 2017-11-07 中文代码示例之Angular入门教程尝试

    "中文编程"知乎专栏原址 原文: 中文代码示例教程之Angular尝试 为了检验中文命名在Angular中的支持程度, 把Angular官方入门教程的示例代码中尽量使用了中文命名. ...

  9. Java Filter防止sql注入攻击

    原理,过滤所有请求中含有非法的字符,例如:, & < select delete 等关键字,黑客可以利用这些字符进行注入攻击,原理是后台实现使用拼接字符串,案例:某个网站的登入验证的SQ ...

  10. SAP MM PO 中的Delivery Date并非保存在EKPO表里

    采购订单行项目中的deliverydate并非如同其它字段值一样是保存在采购订单行项目表EKPO里的, 而是从EKET表里抓取最早的Delivery Date作为该Item的delivery date ...