第7节 信息编码表示
在计算机内部是通过二进制编码的方式表示信息,故在存储信息之前需要先转换成计算机能够识别的编码。
一、西文字符的编码表示—ASCII 码
ASCII 码( American Standard Code for Information Interchange)即美国标准信息交换代码,每个字符占 7 位的二进制位( 单位比特或 bit),能表示 27 = 128 种西文字符,包括大小字母、0—9、控制符( 如回车、空格)、通用符( 如+、=)等字符。
常见的数字、字母的 ASCII 码翻译成十进制如下所示:
字符’0’ —>48
字符’A’ —>65
字符’a’ —>97
1.基本的 ASCII 码
- 存储时占据一个字节,最高位为 0
- 其范围是 0—127
2.扩展的 ASCII 码
- 存储时占据一个字节,最高位为 1
- 其范围是 128—255
3.外码与内码
- 外码:计算机与人进行交换的字形符号,如字符"A"的外码是"A"
- 内码:计算机内部存储和使用的数字代码,如字符"A"的内码是 65
西文字符处理过程:
西文输入 ——> 输入码(外码) ——> 内码(ASCII码) ——> 输出码(外码) ——> 西文输出
二、中文字符的编码表示—GB 码
GB 码即国标码,是汉字交换码,是计算机与其他系统或设备间交换汉字信息的标准编码,采用两个字节对每个汉字进行编码,每个字节各取七位,可对 27 * 27<