【C语言】整型数据在内存中的存储(详解)
慕雪年华

[toc]

数据类型

我们知道,C语言中有很多不同的数据类型

在cppreference.com网站上可以找到C语言中的不同类型【链接】

image

先来认识一个不那么常见的类型

布尔类型

C99中引入了布尔类型 _Bool
实质:把1和0变成ture和false

1
2
3
4
5
6
7
8
9
10
11
#include<stdbool.h>

int main()
{
_Bool flag = true;
if(flag)
{
printf("hehe\n");
}
return 0;
}

代码的效果如下:

image

因为布尔类型和以1-0来判断正误的作用是相同的

所以这个类型我们一般不会使用


无符号数据的打印

Unsigned无符号数用%u打印

image

  • 用%d打印的时候,认为是有符号数
  • 用%u打印无符号数的时候,负数会乱码

我们知道,整型数据在内存中占用4个字节(32位),double类型是8个字节

不同数据占用的字节

image

在之前的学习中,我们已经知道了如何使用这些不同的数据类型

但是你知道,数据在内存中是怎么存储的吗?

这篇博客将带你认识整型在内存中的存储


整型在内存中的存储

先来认识一下整型家族都有谁吧!

整型家族

  • char

    ​ unsigned char

    ​ signed char

  • short

    ​ unsigned short [int]

    ​ signed short [int]

  • int

    ​ unsigned int

    ​ signed int

  • long

    ​ unsigned long [int]

    ​ signed long [int]

我们平时用的最频繁的int其实是signed int

char到底是signed char还是unsigned char,取决于编译器的实现

常见的编译器下,char就是signed char

在知道整型在内存中的存储方式之前

我们需要先认识一下三个好朋友“原 反 补”

“原反补”三兄弟

正整数:原反补码相同

负整数:

原码按照一个数的正负直接写出来的二进制
反码符号位不变,其他位按位取反
补码反码的二进制序列+1,得到补码

二进制要怎么写出来呢?

下面以15为例(前面省略了24位)

每一个1都是2的权重

image

这就是二进制和十进制转换的方式

而15作为正数,原反补码都是这个二进制数

00000000 00000000 00000000 00001111

正数的原反补码相同


什么是符号位?

每一个整型都有4个字节,由32个bit位组成

其中原码的第一位,就是该二进制的符号位

正数为0,负数为1

最高位为符号位,后面的是有效位

再举个-15的例子

10000000 00000000 00000000 00001111原码
11111111 11111111 11111111 11110000反码
11111111 11111111 11111111 11110001补码

为了进一步了解数据在内存中的存储方式,我们将15的==补码==转化为十六进制

每4个二进制比特位对应一个十六进制数,转换结果如下

00000000000000000000000000001111
0000000F

image

可当我们在VS编译器-监视-内存窗口里面查看15数据的时候

展示的是以下的16进制形式

image

可以看到,内存中存储的十六进制,和我们计算出来的是==反着的==

这又是为什么呢?


大小端问题

高位低位来自于人类从左到右的阅读习惯。所以一串二进制数,左侧为高位,右侧为低位

大端字节序存储:

当一个数据的低字节的数据存放在高地址处,高字节序的内容放在了低地址处,这种存储方式就是大端字节序存储

小端字节序存储:

当一个数据的低字节数据存放在低地址处,高字节序的内容放在了高地址处,这种存储方式就是小端字节序存储

简称:小同大异

而我们图中VS内存窗口显示的这种“反着放”的方式,是因为:

  • VS编译器下,内存窗口显示的是左低右高
  • 二进制码是00000000 00000000 00000000 00001111

所以VS编译器是小端存储

image

而如果是以00 00 00 0f的方式放入内存,则是大端字节序存储


负数示例

1
int b=-10
原码10000000000000000000000000001010
反码1111111111111111111111111110101
补码11111111111111111111111111110110
f ff ff ff 6

image

了解了大小端的机制之后,我们可以来写一个简单的函数

判断当前编译器是大端还是小端

image

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#include <stdio.h>
int check_sys()
{
int a=1;
char*p=(char*)&a;
if(1==*p)
return 1;
else
return 0;
}

int main()
{
int b=check_sys();
if(1==b)
printf("小端\n");
else
printf("大端\n");

return 0;
}

这串代码的自定义函数部分可以进行优化

因为*p=1时返回1

其他情况返回0

所以可以选择直接返回*p

1
2
3
4
5
6
7
//代码优化2 
int check_sys()
{
int a=1;
char*p=(char*)&a;
return *p;
}

进一步优化,我们可以把(char*)&a直接进行解引用并返回他的值

这样就能跳过中间变量p

1
2
3
4
5
6
//代码优化3
int check_sys()
{
int a=1;
return *(char*)&a;
}

这里有两个问题需要注意:

不能直接对a进行强制类型转换,这种方式是错的

大小端是把数据放在内存之后才有的现象

大小端讲的是以字节为单位的顺序

char类型只有一个字节,没有大小端问题


为什么整型在内存中存放的是补码呢?

在计算机系统中,数值一般用补码来表示和存储,原因在于,试用补码,可以将符号位和数值域统一处理;

同时,加法和减法也可以统一处理(CPU只有加法器)

此外,补码与反码相互转换,其运算过程是相同的,不需要额外的硬件电路。

计算机中只有加法器,减法用加法来模拟

1-1→1+(-1)

如果用原码的计算:

00000000 00000000 0000000 00000001+
10000000 00000000 0000000 00000001=
10000000 00000000 0000000 00000010-2 错误

补码:

00000000 00000000 0000000 000000011原
10000000 00000000 0000000 00000001-1原

它们的补码

00000000 00000000 00000000 00000001 +1的补码
11111111 11111111 1111111 11111111 =-1的补码
00000000 00000000 0000000 00000000结果为0

其中第一个1为符号位


结语

到这里,整型在内存中存储的基本知识就已经讲完啦

如果对你有帮助,还请不要吝啬手里的赞👍!

能留下个评论就更好了

这对我真的很重要!!!