utf-8编码是目前应用最广泛的字符编码格式,mysql 也可以支持使用 utf-8 编码存储数据。但是,在使用 mysql 存储 utf-8 编码的数据时,可能会出现乱码的问题。这篇文章将介绍在 mysql 中遇到 utf-8 编码乱码的原因以及解决方法。
因为历史原因,mysql 默认采用的是 latin1(iso-8859-1)编码格式。这种编码格式对于大部分西方语言来说还是不错的。但是对于亚洲语言、中东语言等使用复杂字符集的语言来说,就显得力不足了。
随着互联网技术的发展,越来越多的国家和地区使用非拉丁字母的字符集进行文字沟通。为了解决这个问题,mysql 推出了 utf-8 编码格式,使 mysql 能够存储更加丰富的语言文字。utf-8(8-bit unicode transformation format)编码是一种可变长度字符编码,支持 unicode 标准中的所有字符,但是在mysql 中进行 utf-8 编码存储时,可能会出现乱码的情况。
出现乱码的原因和解决方法:
问题1:mysql 表的 charset 不是 utf-8 格式。
在创建表时,如果没有指定 charset,则默认使用数据库的 charset。因此,当数据库charset 不是 utf-8 时,存储 utf-8 编码的数据会出现乱码。
1.1 查看数据库的 charset
首先需要查看数据库的 charset,通过以下命令可以查看当前的数据库 charset:
mysql> show create database databasename;
1.2 修改数据库的 charset
如果数据库的 charset 不是 utf-8 ,需要修改数据库的 charset。可以通过以下步骤修改数据库的 charset:
1.2.1 备份数据库
因为我们需要修改数据库的 charset,所以需要先备份数据库。
1.2.2 修改数据库默认编码
在 mysql 中,创建数据库时可以指定默认编码,默认编码一般设置为 utf-8 ,这里演示如何修改默认编码。
修改 mysql 的配置文件/etc/mysql/mysql.conf.d/mysqld.conf,找到[mysqld],添加以下内容:
[mysqld]character-set-server=utf8mb4collation-server=utf8mb4_general_ci
修改完成之后,保存并退出。
1.2.3 修改数据库和表编码
在 mysql 中,可以通过以下 sql 语句查看数据库、表、列的编码:
/*查看数据库使用的编码*/show variables like 'character_set_database';/*查看数据表使用的编码*/show full columns from 表名;/*查看列使用的编码*/select column_name, character_set_name from information_schema.columns where table_name='表名';
如果当前的编码没有使用 utf-8,那么需要将数据库、表、列的编码都修改为 utf-8 ,可以通过以下 sql 语句进行修改:
/*修改数据库编码为 utf8mb4 */alter database databasename character set utf8mb4 collate utf8mb4_unicode_ci;/*修改表编码为 utf8mb4*/alter table 表名 convert to character set utf8mb4 collate utf8mb4_unicode_ci;/*修改列编码为 utf8mb4*/alter table 表名 modify column 列名 varchar(32) character set utf8mb4 collate utf8mb4_unicode_ci;
修改完成之后,再次执行以上查看编码方法,确认 charset 为 utf-8 编码。
问题2:数据库连接未设置 utf-8 编码
在应用程序连接 mysql 数据库时,需要指定连接字符集,如果没有设置 utf-8 编码,则在读写 utf-8 编码的数据时就会出现乱码。在连接 mysql 数据库时,可以通过以下语句设置 utf-8 编码:
set names utf8mb4;
问题3: mysql 客户端显示编码问题
在使用命令行方式执行 sql 语句是,可能会出现乱码现象,主要是因为客户端显示乱码。可以通过设置 mysql 客户端的编码格式解决该问题。
3.1 linux/macosx 客户端解决乱码
在 linux 和 macosx 系统中,可以通过以下命令设置 mysql 客户端编码格式:
export lang=en_us.utf-8export lc_all=en_us.utf-8
设置完成后,可以运行 mysql 客户端,执行 sql 语句,正常显示中文字符。
3.2 windows 客户端解决乱码
在 windows 系统中,可以通过以下步骤设置 mysql 客户端编码格式:
打开控制面板 -> 系统和安全 -> 系统 -> 高级系统设置 -> 环境变量
在环境变量中,新建系统变量:
变量名:lang变量值:zh_cn.utf-8
设置完成后,可以运行 mysql 客户端,执行 sql 语句,正常显示中文字符。
总结:
在 mysql 中存储 utf-8 编码数据时,可能会出现乱码的问题。乱码问题的原因主要是表的 charset 不是 utf-8 编码格式、数据库连接未设置 utf-8 编码、mysql 客户端显示编码问题。通过在 mysql 中正确配置 charset、连接字符集、客户端编码格式,可以解决 utf-8 编码乱码的问题。
以上就是utf8 mysql 乱码的详细内容。