一文带你了解 GB 18030-2022 字符集

GB18030 全称《‌信息技术 中文编码字符集》‌,‌是我国信息技术领域的强制性国家标准之一,是中华人民共和国国家标准所规定的变长多字节字符集,字符以单字节、双字节或四字节编码。

当前执行标准为 GB 18030-2022,于 2023 年 8 月1 日正式实施,是对 GB18030 标准的第二次修订,第一版为 GB18030-2000 (已废止),第二版为 GB18030-2005 (已废止)。

现行版本共收录汉字 87887 个,由包含了简体和繁体汉字,支持中国少数民族现行文字,包含了日韩等国的象形文字,还包括了 214 个康熙部首(KANGXI RADICALS)。覆盖中国绝大部分人名、地名用生僻字以及文献、科技等专业领域的用字,满足公安、‌地图、‌古籍出版等行业的应用需求。

GB18030 对汉字友好,对 GB/T 2312 完全兼容,对 GBK (已废止) 完全兼容,兼容所有 Unicode 字符。

此外,强制性国家标准 GB 18030-2022 《信息技术中文编码字符集》标准宣贯会暨首批通过认证测试产品发布会于 2023 年 8 月 17 日在北京成功召开。

获得首批 GB 18030-2022 产品认证的企业,参见列表。

alt

可以看到,共有来自 23 家厂商的 29 款数据库产品获证。

序号 公司名称 产品名称
1 平凯星辰(北京)科技有限公司 平凯数据库企业版软件 V7.1
2 北京人大金仓信息技术股份有限公司 金仓数据库管理系统 KingbaseES V8
金仓数据库管理系统 KingbaseES V9
3 武汉达梦数据库股份有限公司 达梦数据库管理系统 V8
4 天津南大通用数据技术股份有限公司 南大通用安全数据库管理系统 V8.8
南大通用大规模分布式并行数据库集群系统 V9.5
南大通用大规模分布式并行数据库集群系统 V9.8
南大通用多模多态数据库管理系统 V5
5 成都虚谷伟业科技有限公司 虚谷数据库管理系统 V11.0
6 腾讯云计算(北京)有限责任公司 腾讯云分布式数据库 TDSQL 管理系统 10.3
TDSQL 关系型数据库管理系统软件 8.0
7 天津神舟通用数据技术有限公司 神通数据库管理系统 V7.0
8 金篆信科有限责任公司 GoldenDB 数据库软件 V6
9 杭州易景数通科技有限公司 義和(Halo)通用数据库系统软件 V1.0
10 北京优炫软件股份有限公司 优炫数据库管理系统 V2.1
11 贵州易鲸捷信息技术有限公司 易鲸捷 QianBase 数据库管理系统软件
12 北京奥星贝斯科技有限公司 OceanBase 数据库软件 V4
13 新华三技术有限公司 H3C 川海数据库系统软件 V2.0
14 华为云计算技术有限公司 GaussDB V2.0
15 云和恩墨(北京)信息技术有限公司 MogDB 企业版数据库管理系统 V3.0
16 福建星瑞格软件有限公司 星瑞格数据库管理系统 SinoDB V16.8
17 北京华宇信息技术有限公司 ArteryBase 数据库管理系统 V3.6
18 北京柏睿数据技术股份有限公司 柏睿数据企业级交易型数据库系统(信创版)V4.0
19 北京海量数据技术股份有限公司 海量数据库管理系统 Vastbase G100 V3.0
20 湖南亚信安慧科技有限公司 亚信安慧 AntDB 数据库系统6.2(集中式)
亚信安慧 AntDB 数据库系统6.2(分布式)
21 深圳九有数据库有限公司 九有数据库 UDB-TX 软件 V2.4
22 阿里云计算有限公司 阿里云 PolarDB 数据库管理软件 V2.0
23 深圳计算科学研究院 崖山数据库 V23

这里以 平凯数据库企业版软件 为例,简要介绍如何在数据库中设定 GB 18030-2022 字符集。

平凯数据库企业版软件 (以下简称“平凯数据库”)是由平凯星辰(北京)科技有限公司(以下简称“平凯星辰”)自主研发的一款分布式数据库产品。

得益于自主创新和架构的先进性,平凯数据库支持在线事务处理(OLTP - Online Transaction Processing) 及混合负载(HTAP - Hybrid Transactional and Analytical Processing),具备高度兼容MySQL 协议和语法、弹性水平扩缩容、金融级高可用、实时分析、云原生等典型技术特点,并提供异构数据(例如Oracle)迁移、备份恢复等一系列企业级周边工具,被广泛应用于海量数据、海量并发、实时在线分析等对稳定性、性能和安全均要求极苛刻的关键业务场景。

目前,平凯数据库自主开源的知名开源项目TiDB Open Core,有超过 1400 多位全球范围的活跃贡献者,同时超过 1500 个企业的真实生产场景。

更多内容参考: 国产基础软件“出海”标杆炼成记

登陆平凯数据库。

alt

查看对 GB18030-2022 字符集的支持情况。

tidb> SHOW CHARACTER SET WHERE CHARSET = 'gb18030';
+---------+---------------------------------+--------------------+--------+
| Charset | Description                     | Default collation  | Maxlen |
+---------+---------------------------------+--------------------+--------+
| gb18030 | China National Standard GB18030 | gb18030_chinese_ci |      4 |
+---------+---------------------------------+--------------------+--------+
1 row in set (0.008 sec)

tidb> SHOW COLLATION WHERE CHARSET = 'gb18030';
+--------------------+---------+------+---------+----------+---------+
| Collation          | Charset | Id   | Default | Compiled | Sortlen |
+--------------------+---------+------+---------+----------+---------+
| gb18030_bin        | gb18030 |  249 |         | Yes      |       1 |
| gb18030_chinese_ci | gb18030 |  248 | Yes     | Yes      |       2 |
+--------------------+---------+------+---------+----------+---------+
2 rows in set (0.001 sec)

注:目前,国际主流开源数据库尚不支持 GB18030-2022 新国标,推荐使用新版本的国产数据库。

🌻 往期精彩 ▼


-- / END / --

👉 这里可以找到我

如果这篇文章为你带来了灵感或启发,就请帮忙点『』or『在看』or『转发』吧,感谢!ღ( ´・ᴗ・` )~

本文由 mdnice 多平台发布

相关推荐

  1. 了解状态机思维

    2024-07-18 12:50:03       59 阅读
  2. 了解机器学习算法

    2024-07-18 12:50:03       55 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-18 12:50:03       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-18 12:50:03       71 阅读
  3. 在Django里面运行非项目文件

    2024-07-18 12:50:03       58 阅读
  4. Python语言-面向对象

    2024-07-18 12:50:03       69 阅读

热门阅读

  1. 处理UI卡死的技巧

    2024-07-18 12:50:03       22 阅读
  2. 在 Debian 12 上安装 budgie-extras-common 包

    2024-07-18 12:50:03       23 阅读
  3. 边缘计算与图像识别:打造无缝的智能体验

    2024-07-18 12:50:03       25 阅读
  4. APScheduler的调度模式

    2024-07-18 12:50:03       18 阅读
  5. Electron 应用关闭突出程序坞

    2024-07-18 12:50:03       20 阅读
  6. 数据可视化入门

    2024-07-18 12:50:03       27 阅读
  7. 用mybatis-plus-generator快速构建简单代码

    2024-07-18 12:50:03       23 阅读
  8. LinearLayout实现原理分析

    2024-07-18 12:50:03       21 阅读
  9. 存储ODS数据的时候为什么在Hive中建立Iceberg表

    2024-07-18 12:50:03       19 阅读
  10. 基于 Gunicorn、Flask 和 Docker 的高并发部署模型

    2024-07-18 12:50:03       21 阅读