数据在内存中的存储

为什么会有大小端模式之分呢？这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着⼀个字节,⼀个字节为8 bit 位,但是在C语⾔中除了8 bit 的 char 之外,还有16 bit 的 short 型，32 bit 的 long 型（要看具体的编译器）,另外,对于位数⼤于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于⼀个字节,那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：⼀个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式，就将 0x11放在低地址中,即 0x0010 中,0x22 放在⾼地址中,即 0x0011 中。小端模式，刚好相反。我们常⽤的 X86 结构是小端模式，而 KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

2.3练习

2.3.1 练习1

代码判断当前机器的字节序。

#include <stdio.h>
int main()
{
	int a = 1;
	char* p = &a;
	if (*p == 1)
		printf("小端\n");
	else
		printf("大端\n");
	return 0;
}

在vs编译器下就是小端存储。

2.3.2 练习2

#include <stdio.h>
int main()
{
 char a= -1;
 signed char b=-1;
 unsigned char c=-1;
 printf("a=%d,b=%d,c=%d",a,b,c);
 return 0;
}

上述代码的执行结果是什么。

我们要直到在C语言中,char是有符号还是无符号呢?这个是不确定的,是取决于编译器的,但是在大部分的编译器上char就等价于signed char,vs编译器也不例外,char和signed char打印的都是-1,那么就说明在vs编译器上char就等价于signed char。

从代码的执行结果看为什么变量c是255呢?

-1是整型,一个整型类型的数据赋给char类型的变量会截断。

一个整型的值赋给一个char类型的变量,首先会截断,取补码的低八位整型提升,然后是无符号的char的话前面补0,是有符号的char的话前面补符号位。

2.3.3 练习3

#include <stdio.h>
int main()
{
 char a = -128;
 printf("%u\n",a);
 return 0;
}

这段代码的执行结果是什么?

为什么会是这么大的数字呢?

-128先算出补码,char类型是八位,截取-128最低的八位,然后整型提升,char是有符号的char,所以会把最高位理解为是符号位,补1,%u打印的是无符号的整数,所以会把整型提升后的补码看成无符号的整型。

#include <stdio.h>
int main()
{
 char a = 128;
 printf("%u\n",a);
 return 0;
}

这段代码的执行结果是什么?

那为什么和上段代码的结果一样呢?

128和-128截断之后在a里面放的二进制位是一摸一样的，所以它们整型提升,用%u打印出来的结果也是一样的。

char类型的取值范围是-128~127，所以128这个数值存不下。

char占一个字节,八个比特位。

所以char类型是存不下128,129这样的数字。

上图是有符号的char,下面我们看看无符号的char。

无符号的char都是数据位,没有符号位,所以表示的范围会更大一点。

现在char类型理解了,那short类型应该怎么理解。

那么这个signed和unsigned有什么用呢?

比如:signed int，signed char，unsigned int，unsigned char

举个例子:

为什么这两个值截然不同呢?

-10我放到有符号的a里面,当用%d打印的时候里面确实放的有符号数,这是匹配的,所以用%d确实可以打印出-10,如果用%u打印就认为内存中存的是无符号的数,-10放到内存中的补码就认为是无符号的数,所以打印出的结果很大,内存中存的什么类型说了不算,是怎么用,用%d打印是-10,用%u打印就是4294967286,怎么用是最重要的,跟类型无关。

对比:

从两个图的运行结果可以看出类型好像没起作用,不管是有符号数还是无符号的数,结果都是一样的,类型好像失效了,这里用%d或者%u打印,这个类型决定了如何看这个数据,决定了输出的结果,类型无非就是向内存申请四个字节的空间,类型就是创建变量的,那我如何看待这块空间里的数据,这才是最重要的。

其实上面举例子的代码不建议这样写。

当我写signed int的时候我就希望是有符号的,打印的时候就应该用%d,这样才能匹配起来。

当我写unsigned int的时候我就希望是无符号的数,打印的时候就应该用%u。

signed和unsigned就是用来区分的,如果我只需要0和正整数就用unsigned来创建变量,如果需要负数就用signed来创建变量。

2.3.4 练习4

#include <stdio.h>
#include <string.h>
int main()
{
	char a[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
		a[i] = -1 - i;
	}
	printf("%zd", strlen(a));
	return 0;
}

这段代码的执行结果是什么?

那为什么是255呢?

2.3.5 练习5

#include <stdio.h>
unsigned char i = 0;
int main()
{
 for(i = 0;i<=255;i++)
 {
 printf("hello world\n");
 }
 return 0;
}

注意条件部分以及unsigned char类型的取值范围。

#include <stdio.h>
int main()
{
 unsigned int i;
 for(i = 9; i >= 0; i--)
 {
 printf("%u\n",i);
 }
 return 0;
}

我们可以让睡眠一秒打印一个值观察一下。

我们可以看到0减去1就是一个非常大的数字,因为0减去1实际上是-1,但是-1被%u打印的时候是一个非常大的数字。

2.3.6 练习6

#include <stdio.h>
//X86环境 ⼩端字节序
int main()
{
 int a[4] = { 1, 2, 3, 4 };
 int *ptr1 = (int *)(&a + 1);
 int *ptr2 = (int *)((int)a + 1);
 printf("%x,%x", ptr1[-1], *ptr2);
 return 0;
}

要理解整型+1和指针+1。

#include <stdio.h>
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 return 0;
}

如果前面想带上0x也可以自己在前面加,或者%和x中间加个#。

3. 浮点数在内存中的存储

常见的浮点数：3.14159,1E10等,浮点数类型包括： float,double,long double 类型。浮点数表示的范围： float.h 中定义

3.1 题目

#include <stdio.h>
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为：%d\n",n);
 printf("*pFloat的值为：%f\n",*pFloat);
 return 0;
}

这段代码的执行结果是什么:

3.2 浮点数的额存储

上上面的代码可以看出整型变量里面放一个9,以%d打印的时候没有问题,但是将n的地址强转为float类型的指针赋给pFloat类型的指针变量的时候取出来就不是9了,然后又在里面放9.0,以%d的形式打印又不是9,以%f的形式打印就合适了,这就说明整型和浮点型在内存中存储是有区别的。

要理解这个结果，⼀定要搞懂浮点数在计算机内部的表⽰⽅法。

根据国际标准IEEE（电气和电子⼯程协会） 754，任意⼀个⼆进制浮点数V可以表示成下面的形式： V = (−1) ∗ S M ∗ 2E

(−1)S 表示符号位，当S=0，V为正数；当S=1，V为负数

M 表示有效数字，M是大于等于1，小于2的

2E表示指数位

IEEE 754规定：

对于32位的浮点数，最⾼的1位存储符号位S，接着的8位存储指数E，剩下的23位存储有效数字M 对于64位的浮点数，最⾼的1位存储符号位S，接着的11位存储指数E，剩下的52位存储有效数字M

3.2 浮点数的存储

3.2.1 浮点数存的过程

前⾯说过， 1≤M<2 ，也就是说，M可以写成 1.xxxxxx 的形式，其中 xxxxxx 表示小数部分。 IEEE 754 规定，在计算机内部保存M时，默认这个数的第⼀位总是1，因此可以被舍去，只保存后⾯的 xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第⼀位的1加上去。这样做的⽬的，是节省1位有效数字。以32位浮点数为例，留给M只有23位，将第⼀位的1舍去以后，等于可以保存24位有效数字。

至于指数E，情况就比较复杂

⾸先，E为⼀个⽆符号整数（unsigned int）

这意味着，如果E为8位，它的取值范围为0~255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存入内存时E的真实值必须再加上⼀个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。比如，2^10的E是 10，所以保存成32位浮点数时，必须保存成10+127=137，即10001001。

3.2.2 浮点数取的过程

指数E从内存中取出还可以再分成三种情况： (常规情况)

E不全为0或不全为1 这时，浮点数就采⽤下⾯的规则表⽰，即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第⼀位的1。比如：0.5 的⼆进制形式为0.1，由于规定正数部分必须为1，即将小数点右移1位，则为1.0*2^(-1)，其阶码为-1+127(中间值)=126，表⽰为01111110，⽽尾数1.0去掉整数部分为0，补齐0到23位 00000000000000000000000，则其⼆进制表示形式为: