数据在内存中的存储

目录

1.整数在内存中的存储

2. 大小端字节序和字节序判断

2.1 什么是大小端?

2.2 为什么有大小端?

2.3练习

2.3.1 练习1

2.3.2 练习2

2.3.3 练习3

2.3.4 练习4

2.3.5 练习5

2.3.6 练习6

3. 浮点数在内存中的存储

3.1 题目

​编辑 3.2 浮点数的存储  

3.2.1 浮点数存的过程 

3.2.2 浮点数取的过程

指数E从内存中取出还可以再分成三种情况: (常规情况)

E全为0

E全为1

3.3 题目解析


1.整数在内存中的存储

整数的二进制表示有三种:原码,反码,补码。

有符号的整数,三种表示方法均有符号位和数值位两部分,符号位都是用0表示正,用1表示负,最高位的一位是被当作符号位,剩余的都是数值位。

正整数的原码,反码,补码都是相同的。

负整数的原码,反码,补码是不相同的。

那么负整数的原码,反码,补码都是怎么计算出来的呢?

原码:直接将数值按照正负数的形式翻译成⼆进制得到的就是原码。

反码:将原码的符号位不变,其他位依次按位取反就可以得到反码。

补码:反码+1就得到补码。

对于整形来说:数据存放内存中其实存放的是补码。

整数有原码,反码,补码三种二进制的表示形式,但是内存中存放的是补码,计算使用的是内存中的二进制,也就是补码。

在计算机系统中,数值⼀律用补码来表示和存储。 原因在于,使用补码,可以将符号位和数值域统⼀处理,同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

2. 大小端字节序和字节序判断

当我们了解了整数在内存中存储后,我们调试看⼀个细节:

我们可以看到我们放进去的是0x11223344,可是为什么调试的时候是44332211,为什么倒过来了呢?

这个时候就涉及到大小端的问题了。

2.1 什么是大小端?

其实超过⼀个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分 为⼤端字节序存储和⼩端字节序存储。

如上图所示,不管我怎么存储,正着存储也好,倒着存储也罢,就算是打乱存储也是可以的,但是用的时候要能拿出来,不关心怎么放进去的,但是后两种打乱存储的拿出来的话会很麻烦,但是前两种倒着存储或者正者存储拿出来的话比较方便,所以数据在内存中存储的时候就留下了这两种方式。

 大端(存储)模式: 是指数据的低位字节内容保存在内存的高地址处,而数据的高位字节内容,保存在内存的低地址处。

小端(存储)模式: 是指数据的低位字节内容保存在内存的低地址处,而数据的高位字节内容,保存在内存的⾼地址处。

为什么要叫大端字节序,小端字节序,因为它是以字节为单位来讨论顺序的。

所以从前面的代码的调试可以看出在vs编译器上是小端存储模式。

2.2 为什么有大小端?

为什么会有大小端模式之分呢? 这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着⼀个字节,⼀个字节为8 bit 位,但是在C语⾔中除了8 bit 的 char 之外,还有16 bit 的 short 型,32 bit 的 long 型(要看 具体的编译器),另外,对于位数⼤于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于⼀个字节,那么必然存在着⼀个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存 储模式。

例如:⼀个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22 为低字节。对于大端模式,就将 0x11放在低地址中,即 0x0010 中,0x22 放在⾼地址中,即 0x0011 中。小端模式,刚好相反。我们常⽤的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是 大端模式还是小端模式。

2.3练习

2.3.1 练习1

代码判断当前机器的字节序。

#include <stdio.h>
int main()
{
	int a = 1;
	char* p = &a;
	if (*p == 1)
		printf("小端\n");
	else
		printf("大端\n");
	return 0;
}

在vs编译器下就是小端存储。

2.3.2 练习2
#include <stdio.h>
int main()
{
 char a= -1;
 signed char b=-1;
 unsigned char c=-1;
 printf("a=%d,b=%d,c=%d",a,b,c);
 return 0;
}

上述代码的执行结果是什么。

我们要直到在C语言中,char是有符号还是无符号呢?这个是不确定的,是取决于编译器的,但是在大部分的编译器上char就等价于signed char,vs编译器也不例外,char和signed char打印的都是-1,那么就说明在vs编译器上char就等价于signed char。

从代码的执行结果看为什么变量c是255呢?

 -1是整型,一个整型类型的数据赋给char类型的变量会截断。

一个整型的值赋给一个char类型的变量,首先会截断,取补码的低八位整型提升,然后是无符号的char的话前面补0,是有符号的char的话前面补符号位。

2.3.3 练习3
#include <stdio.h>
int main()
{
 char a = -128;
 printf("%u\n",a);
 return 0;
}

这段代码的执行结果是什么?

 为什么会是这么大的数字呢?

-128先算出补码,char类型是八位,截取-128最低的八位,然后整型提升,char是有符号的char,所以会把最高位理解为是符号位,补1,%u打印的是无符号的整数,所以会把整型提升后的补码看成无符号的整型。

#include <stdio.h>
int main()
{
 char a = 128;
 printf("%u\n",a);
 return 0;
}

这段代码的执行结果是什么?

 那为什么和上段代码的结果一样呢?

128和-128截断之后在a里面放的二进制位是一摸一样的,所以它们整型提升,用%u打印出来的结果也是一样的。

char类型的取值范围是-128~127,所以128这个数值存不下。

char占一个字节,八个比特位。

 所以char类型是存不下128,129这样的数字。

上图是有符号的char,下面我们看看无符号的char。

无符号的char都是数据位,没有符号位,所以表示的范围会更大一点。

现在char类型理解了,那short类型应该怎么理解。

那么这个signed和unsigned有什么用呢?

比如:signed int,signed char,unsigned int,unsigned char

举个例子: 

 为什么这两个值截然不同呢?

-10我放到有符号的a里面,当用%d打印的时候里面确实放的有符号数,这是匹配的,所以用%d确实可以打印出-10,如果用%u打印就认为内存中存的是无符号的数,-10放到内存中的补码就认为是无符号的数,所以打印出的结果很大,内存中存的什么类型说了不算,是怎么用,用%d打印是-10,用%u打印就是4294967286,怎么用是最重要的,跟类型无关。

对比:

 从两个图的运行结果可以看出类型好像没起作用,不管是有符号数还是无符号的数,结果都是一样的,类型好像失效了,这里用%d或者%u打印,这个类型决定了如何看这个数据,决定了输出的结果,类型无非就是向内存申请四个字节的空间,类型就是创建变量的,那我如何看待这块空间里的数据,这才是最重要的。

其实上面举例子的代码不建议这样写。

当我写signed int的时候我就希望是有符号的,打印的时候就应该用%d,这样才能匹配起来。

当我写unsigned int的时候我就希望是无符号的数,打印的时候就应该用%u。

signed和unsigned就是用来区分的,如果我只需要0和正整数就用unsigned来创建变量,如果需要负数就用signed来创建变量。

2.3.4 练习4
#include <stdio.h>
#include <string.h>
int main()
{
	char a[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
		a[i] = -1 - i;
	}
	printf("%zd", strlen(a));
	return 0;
}

这段代码的执行结果是什么?

那为什么是255呢?

2.3.5 练习5
#include <stdio.h>
unsigned char i = 0;
int main()
{
 for(i = 0;i<=255;i++)
 {
 printf("hello world\n");
 }
 return 0;
}

 

注意条件部分以及unsigned char类型的取值范围。

#include <stdio.h>
int main()
{
 unsigned int i;
 for(i = 9; i >= 0; i--)
 {
 printf("%u\n",i);
 }
 return 0;
}

 

我们可以让睡眠一秒打印一个值观察一下。

 我们可以看到0减去1就是一个非常大的数字,因为0减去1实际上是-1,但是-1被%u打印的时候是一个非常大的数字。

2.3.6 练习6
#include <stdio.h>
//X86环境 ⼩端字节序
int main()
{
 int a[4] = { 1, 2, 3, 4 };
 int *ptr1 = (int *)(&a + 1);
 int *ptr2 = (int *)((int)a + 1);
 printf("%x,%x", ptr1[-1], *ptr2);
 return 0;
}

要理解整型+1和指针+1。 

#include <stdio.h>
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 return 0;
}

如果前面想带上0x也可以自己在前面加,或者%和x中间加个#。 

3. 浮点数在内存中的存储

常见的浮点数:3.14159,1E10等,浮点数类型包括: float,double,long double 类型。 浮点数表示的范围: float.h 中定义

3.1 题目

#include <stdio.h>
int main()
{
 int n = 9;
 float *pFloat = (float *)&n;
 printf("n的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 *pFloat = 9.0;
 printf("num的值为:%d\n",n);
 printf("*pFloat的值为:%f\n",*pFloat);
 return 0;
}

这段代码的执行结果是什么:

3.2 浮点数的额存储

上上面的代码可以看出整型变量里面放一个9,以%d打印的时候没有问题,但是将n的地址强转为float类型的指针赋给pFloat类型的指针变量的时候取出来就不是9了,然后又在里面放9.0,以%d的形式打印又不是9,以%f的形式打印就合适了,这就说明整型和浮点型在内存中存储是有区别的。

要理解这个结果,⼀定要搞懂浮点数在计算机内部的表⽰⽅法。

根据国际标准IEEE(电气和电子⼯程协会) 754,任意⼀个⼆进制浮点数V可以表示成下面的形式: V   =  (−1) ∗ S M ∗ 2E

(−1)S 表示符号位,当S=0,V为正数;当S=1,V为负数

M 表示有效数字,M是大于等于1,小于2的

2E表示指数位

 IEEE 754规定:

对于32位的浮点数,最⾼的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M 对于64位的浮点数,最⾼的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M

 

 
3.2 浮点数的存储  

3.2.1 浮点数存的过程 

前⾯说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中 xxxxxx 表示小数部分。 IEEE 754 规定,在计算机内部保存M时,默认这个数的第⼀位总是1,因此可以被舍去,只保存后⾯的 xxxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第⼀位的1加上去。这样做的⽬ 的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保 存24位有效数字。

至于指数E,情况就比较复杂

⾸先,E为⼀个⽆符号整数(unsigned int)

这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我 们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上 ⼀个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。比如,2^10的E是 10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

3.2.2 浮点数取的过程
指数E从内存中取出还可以再分成三种情况: (常规情况)

E不全为0或不全为1 这时,浮点数就采⽤下⾯的规则表⽰,即指数E的计算值减去127(或1023),得到真实值,再将有效 数字M前加上第⼀位的1。 比如:0.5 的⼆进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其 阶码为-1+127(中间值)=126,表⽰为01111110,⽽尾数1.0去掉整数部分为0,补齐0到23位 00000000000000000000000,则其⼆进制表示形式为:

0 01111110 00000000000000000000000
E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还 原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。

 0 00000000 00100000000000000000000
E全为1

这时,如果有效数字M全为0,表示±⽆穷大(正负取决于符号位s); 

0 11111111 00010000000000000000000

从调试我们可以看出内存中确实存的是S,M,E三个值。 

3.3 题目解析

当我将n的地址强转为float类型的指针赋给pFloat指针变量的时候,解引用的时候*pFloat会把内存中的数据看作成浮点数。

 

完。 

相关推荐

  1. 数据内存存储

    2024-06-07 19:54:04       58 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-07 19:54:04       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-07 19:54:04       106 阅读
  3. 在Django里面运行非项目文件

    2024-06-07 19:54:04       87 阅读
  4. Python语言-面向对象

    2024-06-07 19:54:04       96 阅读

热门阅读

  1. NLP基础——语言模型(动手学深度学习)

    2024-06-07 19:54:04       25 阅读
  2. 【怀旧版】win10中从零开始创建vue2+ElementUI项目

    2024-06-07 19:54:04       30 阅读
  3. 【实用技巧】Unity的Transform组件实用技巧

    2024-06-07 19:54:04       25 阅读
  4. 每日一题:聊聊 Redis 过期键的删除策略

    2024-06-07 19:54:04       29 阅读
  5. 函数或变量 ‘tfrstft‘ 无法识别

    2024-06-07 19:54:04       29 阅读
  6. 新能源汽车企业的图纸防泄密解决方案

    2024-06-07 19:54:04       23 阅读
  7. 使用React Hooks有什么优势

    2024-06-07 19:54:04       25 阅读
  8. 笔记93:关于 C++ 中的 Eigen 库

    2024-06-07 19:54:04       31 阅读
  9. shell 变量

    2024-06-07 19:54:04       25 阅读
  10. python的rolling_mean()函数

    2024-06-07 19:54:04       29 阅读
  11. RGMII接口--->(001)FPGA实现RGMII接口(一)

    2024-06-07 19:54:04       28 阅读
  12. 从技术层面出发,如何确保云安全?

    2024-06-07 19:54:04       30 阅读