常见编码方式


今天我们来谈谈常见的编码

讲一下常见编码方式?

编码的意义:计算机中存储的最小单元是一个字节即 8bit,所能表示的字符范围是 255 个, 而人类要表示的符号太多,无法用一个字节来完全表示,固需要将符号编码,将各种语言翻译成计算机能懂的语言。

ASCII 码:

总共 128 个,用一个字节的低 7 位表示,0〜31 控制字符如换回车删除等;
32~126 是打印字符,可通过键盘输入并显示出来;

ISO-8859-1,

用来扩展 ASCII 编码,256 个字符,涵盖了大多数西欧语言字符。

GB2312:

双字节编码,总编码范围是 A1-A7,A1-A9 是符号区,包含 682 个字符,B0-B7 是 汉字区,包含 6763 个汉字;

GBK

为了扩展 GB2312,加入了更多的汉字,编码范围是 8140~FEFE,有 23940 个码位,能 表示 21003 个汉字。

UTF-16:

ISO 试图想创建一个全新的超语言字典,世界上所有语言都可通过这本字典

Unicode

来相互翻译,而 UTF-16 定义了 Unicode 字符在计算机中存取方法,用两个字节来表 示 Unicode 转化格式。不论什么字符都可用两字节表示,即 16bit,固叫 UTF-
16。

UTF-8:

UTF-16 统一采用两字节表示一个字符,但有些字符只用一个字节就可表示,浪费存储空间,而 UTF-8 采用一种变长技术,每个编码区域有不同的字码长度。 不同类型的 字 符 可 以 由 1~6 个字节组成。

相关推荐

  1. 常见编码方式

    2023-12-17 17:50:03       41 阅读
  2. 编程常见的技术难题及解决方案

    2023-12-17 17:50:03       36 阅读
  3. 常见通信方式之Websocket

    2023-12-17 17:50:03       21 阅读
  4. 前端常见的加密方式

    2023-12-17 17:50:03       8 阅读
  5. tomcat 常见优化方案

    2023-12-17 17:50:03       14 阅读
  6. 常见接口优化方法

    2023-12-17 17:50:03       17 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-17 17:50:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-17 17:50:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-17 17:50:03       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-17 17:50:03       20 阅读

热门阅读

  1. 《微信小程序开发从入门到实战》学习五十

    2023-12-17 17:50:03       37 阅读
  2. 【力扣100】73.矩阵置零

    2023-12-17 17:50:03       46 阅读
  3. 复盘步骤| 每天,每周,每年

    2023-12-17 17:50:03       36 阅读
  4. 算法基础十五

    2023-12-17 17:50:03       31 阅读