MySQL-字符集(charset)和校对规则(collation)

1 需求


2 接口


3 collation

在 MySQL 中,如果你想在创建表之前统一设置 collation(字符集校对规则),你通常可以在创建表的时候为每个字段明确指定 collation,或者你可以在数据库级别或表级别设置默认的 collation。

1. 数据库级别设置默认 collation

当你创建一个新的数据库时,可以指定默认的字符集和 collation。这会影响在该数据库中创建的所有表(除非在表级别另行指定)。

CREATE DATABASE mydatabase
CHARACTER SET utf8mb4
COLLATE utf8mb4_unicode_ci;

在这个例子中,utf8mb4 是字符集,而 utf8mb4_unicode_ci 是 collation。

2. 表级别设置默认 collation

在创建表时,你可以为整个表设置默认的字符集和 collation。然后,你可以为表中的每个字段单独指定 collation(如果需要的话),或者让字段继承表的默认 collation。

CREATE TABLE mytable (
id INT AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(255) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

在这个例子中,mytable 表的默认字符集是 utf8mb4,默认 collation 是 utf8mb4_unicode_ciname 字段没有指定 collation,所以它会继承表的默认 collation。

3. 字段级别设置 collation

如果你需要在字段级别设置 collation,你可以在创建字段时明确指定它。

CREATE TABLE mytable (
id INT AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL,
description TEXT COLLATE utf8mb4_general_ci
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

在这个例子中,name 字段使用了 utf8mb4_unicode_ci collation,而 description 字段使用了 utf8mb4_general_ci collation。注意,尽管表的默认字符集是 utf8mb4,但每个字段都可以有自己的 collation。

4. 修改已存在数据库的 collation

如果你已经有一个存在的数据库,并想更改其默认的 collation,你需要为每个表(和每个表的字段,如果需要的话)单独设置 collation。这通常是一个复杂的过程,因为它可能涉及到大量的 ALTER TABLE 语句,并且可能会影响到数据的完整性(例如,如果你试图更改已经存储了数据的字段的 collation)。

注意:

  • 在选择 collation 时,请确保它与你的数据和应用程序的需求相匹配。不同的 collation 在处理字符比较和排序时可能会有不同的行为。
  • 使用 utf8mb4 字符集通常是一个好的选择,因为它可以支持所有 Unicode 字符,包括一些表情符号和其他特殊字符。但是,请注意,使用 utf8mb4 可能会增加存储空间的消耗。

要查询 MySQL 数据库中每个数据库的字符集(charset)和校对规则(collation),你可以查询 information_schema 数据库中的 SCHEMATA 表。以下是如何做到这一点的 SQL 查询:

SELECT
SCHEMA_NAME AS `Database`,
DEFAULT_CHARACTER_SET_NAME AS `Charset`,
DEFAULT_COLLATION_NAME AS `Collation`
FROM
information_schema.SCHEMATA;

这个查询将返回所有数据库的列表,以及每个数据库的默认字符集和校对规则。

如果你只想查询特定数据库的字符集和校对规则,你可以在查询中添加一个 WHERE 子句来限制结果:

SELECT
SCHEMA_NAME AS `Database`,
DEFAULT_CHARACTER_SET_NAME AS `Charset`,
DEFAULT_COLLATION_NAME AS `Collation`
FROM
information_schema.SCHEMATA
WHERE
SCHEMA_NAME = 'your_database_name';

将 'your_database_name' 替换为你想要查询的数据库名称。

请注意,这些查询将返回数据库的默认字符集和校对规则。但是,数据库中的每个表或每个表的每个列都可以有自己的字符集和校对规则。要查询这些更具体的设置,你需要查询 information_schema.TABLES 和 information_schema.COLUMNS 表。


4 参考资料

相关推荐

  1. MySQL-字符集charset校对规则collation

    2024-07-16 04:56:03       27 阅读
  2. mysql更新charset

    2024-07-16 04:56:03       44 阅读
  3. MySQL十部曲之三:字符集排序规则

    2024-07-16 04:56:03       41 阅读
  4. mysqlcharset是什么 有哪些?

    2024-07-16 04:56:03       54 阅读
  5. 一文彻底弄懂MySQL字符集排序规则

    2024-07-16 04:56:03       41 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-16 04:56:03       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-16 04:56:03       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-16 04:56:03       58 阅读
  4. Python语言-面向对象

    2024-07-16 04:56:03       69 阅读

热门阅读

  1. 掌握Eureka:打造高效服务配置中心集成

    2024-07-16 04:56:03       28 阅读
  2. Docker的基本认识和常见命令以及场景介绍

    2024-07-16 04:56:03       21 阅读
  3. Spark和Hadoop作业之间的区别

    2024-07-16 04:56:03       28 阅读
  4. 七大排序算法的Python实现

    2024-07-16 04:56:03       22 阅读
  5. Linux命令更新-sort 和 uniq 命令

    2024-07-16 04:56:03       29 阅读
  6. 中介子方程五十九

    2024-07-16 04:56:03       25 阅读
  7. linux查找/搜索命令

    2024-07-16 04:56:03       27 阅读
  8. Django REST Framework(八)GenericAPIView5个视图扩展类

    2024-07-16 04:56:03       21 阅读