侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

MySQL字符集乱码及解决方案分享

数据库  /  管理员 发布于 6年前   244

前言

字符集是一套符号和编码的规则,不论是在oracle数据库还是在mysql数据库,都存在字符集的选择问题,而且如果在数据库创建阶段没有正确选择字符集,那么可能在后期需要更换字符集,而字符集的更换是代价比较高的操作,也存在一定的风险,所以,我们推荐在应用开始阶段,就按照需求正确的选择合适的字符集,避免后期不必要的调整。

实战

1、安装MySQL数据库

2、乱码演示

mysql> show variables like 'character_set%';+--------------------------+----------------------------------+| Variable_name  | Value    |+--------------------------+----------------------------------+| character_set_client | utf8    || character_set_connection | utf8    || character_set_database | utf8    || character_set_filesystem | binary    || character_set_results | utf8    || character_set_server | utf8    || character_set_system | utf8    || character_sets_dir | /usr/local/mysql/share/charsets/ |+--------------------------+----------------------------------+8 rows in set (0.00 sec) mysql> insert into test.table10 values (1,'云中鹤');Query OK, 1 row affected (0.00 sec) mysql> select * from test.table10;+------+-----------+| id | names |+------+-----------+| 1 | 云中鹤 |+------+-----------+1 row in set (0.00 sec) mysql> set names latin1;Query OK, 0 rows affected (0.00 sec) mysql> select * from test.table10;+------+-------+| id | names |+------+-------+| 1 | ??? |+------+-------+1 row in set (0.00 sec) mysql> show variables like 'character_set%';+--------------------------+----------------------------------+| Variable_name  | Value    |+--------------------------+----------------------------------+| character_set_client | latin1 #客户端来源数据使用的字符集   | character_set_connection | latin1 # 连接层字符集| character_set_database | utf8 #当前选中数据库的默认字符集   | character_set_filesystem | binary   | character_set_results | latin1 #查询结果字符集 || character_set_server | utf8 #默认的内部操作字符集   || character_set_system | utf8 #系统元数据(字段名等)字符集     | character_sets_dir | /usr/local/mysql/share/charsets/ |+--------------------------+----------------------------------+8 rows in set (0.00 sec)

乱码解决办法

从上面可以看出,set names latin1;改变了三个参数.. 只要做到客户端,MySQL character-set-client,table charset三个字符集完全一致就可以保证一定不会有乱码出现。

方式:

​       1、在mysql命令行模式下执行set names xxx;

 mysql> set names utf8; Query OK, 0 rows affected (0.01 sec)

       2、登录mysql的时候指定默认字符集

 [root@node1 ~]# mysql -S /tmp/mysql.sock4 --defaults-character-set=utf8 #-S 指定多实例mysql的套接字文件, 使用--defaults-character-set 指定默认字符集。

​       3、 修改/etc/sysconfig/i18n 文件,在my.cnf不指定默认字符集的情况下。

 vim /etc/sysconfig/i18n LANG='zh_CN.UTF-8' #如果my.cnf不指定,默认使用系统字符集

​       4、  修改my.cnf 文件,下面两个字段在任意一个字段都是可以的。

  [client]  default-character-set=latin1
  [mysql]  default-character-set=latin1

​    前两种1,2是临时解决方案,后面两种3,4是永久有效的方案

查看字符集

1、查看系统当前字符集设置,修改之后登陆mysql执行。show variables lile 'character_set%';

mysql> show variables like 'character_set%';#我修改的为utf8,所以客户端的三个参数都是utf8.你可以自行设置字符集。+--------------------------+----------------------------------+| Variable_name   | Value       |+--------------------------+----------------------------------+| character_set_client  | utf8        || character_set_connection | utf8        || character_set_database | utf8        || character_set_filesystem | binary       || character_set_results | utf8        || character_set_server  | utf8        || character_set_system  | utf8        || character_sets_dir  | /usr/local/mysql/share/charsets/ |

2、mysql常用字符集。执行命令show character set; 查看系统支持字符集。

mysql> show character set;+----------+-----------------------------+---------------------+--------+| Charset | Description     | Default collation | Maxlen |+----------+-----------------------------+---------------------+--------+| big5  | Big5 Traditional Chinese | big5_chinese_ci  |  2 || dec8  | DEC West European   | dec8_swedish_ci  |  1 || cp850 | DOS West European   | cp850_general_ci |  1 || hp8  | HP West European   | hp8_english_ci  |  1 || koi8r | KOI8-R Relcom Russian  | koi8r_general_ci |  1 || latin1 | cp1252 West European  | latin1_swedish_ci |  1 | #常用| latin2 | ISO 8859-2 Central European | latin2_general_ci |  1 || swe7  | 7bit Swedish    | swe7_swedish_ci  |  1 || ascii | US ASCII     | ascii_general_ci |  1 || ujis  | EUC-JP Japanese    | ujis_japanese_ci |  3 || sjis  | Shift-JIS Japanese   | sjis_japanese_ci |  2 || hebrew | ISO 8859-8 Hebrew   | hebrew_general_ci |  1 || tis620 | TIS620 Thai     | tis620_thai_ci  |  1 || euckr | EUC-KR Korean    | euckr_korean_ci  |  2 || koi8u | KOI8-U Ukrainian   | koi8u_general_ci |  1 || gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci |  2 || greek | ISO 8859-7 Greek   | greek_general_ci |  1 || cp1250 | Windows Central European | cp1250_general_ci |  1 || gbk  | GBK Simplified Chinese  | gbk_chinese_ci  |  2 | #常用| latin5 | ISO 8859-9 Turkish   | latin5_turkish_ci |  1 || armscii8 | ARMSCII-8 Armenian   | armscii8_general_ci |  1 || utf8  | UTF-8 Unicode    | utf8_general_ci  |  3 |#常用| ucs2  | UCS-2 Unicode    | ucs2_general_ci  |  2 || cp866 | DOS Russian     | cp866_general_ci |  1 || keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci |  1 || macce | Mac Central European  | macce_general_ci |  1 || macroman | Mac West European   | macroman_general_ci |  1 || cp852 | DOS Central European  | cp852_general_ci |  1 || latin7 | ISO 8859-13 Baltic   | latin7_general_ci |  1 || utf8mb4 | UTF-8 Unicode    | utf8mb4_general_ci |  4 | #常用| cp1251 | Windows Cyrillic   | cp1251_general_ci |  1 || utf16 | UTF-16 Unicode    | utf16_general_ci |  4 || cp1256 | Windows Arabic    | cp1256_general_ci |  1 || cp1257 | Windows Baltic    | cp1257_general_ci |  1 || utf32 | UTF-32 Unicode    | utf32_general_ci |  4 || binary | Binary pseudo charset  | binary    |  1 || geostd8 | GEOSTD8 Georgian   | geostd8_general_ci |  1 || cp932 | SJIS for Windows Japanese | cp932_japanese_ci |  2 || eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci |  3 |+----------+-----------------------------+---------------------+--------+39 rows in set (0.00 sec)

字符集选择

​      1、如果处理各种各样的文字,发布到不同语言国家地区,选择Unicode。,对mysql对号utf-8。

​      2、只需中文,数据量很大,性能要求也高,选择gbk.。

​      3、处理移动物联网业务,选utf8mb4

​      建议在能够完全满足应用的前提下,尽量使用小的字符集。因为更小的字符集意味着能够节省空间、减少网络传输字节数,同时由于存储空间的较小间接的提高了系统的性能。

服务器字符集设置

[mysqld]...character-set-server=utf8 #添加这条语句,可设置服务器端字符集。

mysql服务端重新启动后,这两个参数会改变为设定值。

| character_set_server  | utf8 | character_set_database | utf8

切换字符集

将一种编码的数据库转换为另一种编码的数据。

alter database dbname character set xxx; #只能对以后的数据有效,对之前的数据无效。基本不使用

常用转换数据库字符集方案

mysqldump -S /tmp/mysql.sock4 --default-character-set=utf8 -d test > /data/test-`date +%F`.sql #1、导出表结构而不导出数据vim /data/test-`date +%F`.sqlDROP TABLE IF EXISTS `table10`;/*!40101 SET @saved_cs_client  = @@character_set_client */;/*!40101 SET character_set_client = utf8 */;CREATE TABLE `table10` ( `id` int(11) DEFAULT NULL, `names` char(20) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET=utf8; #2、这里的CHARSET改为你想要修改的字符集mysqldump -S /tmp/mysql.sock4 --extended-insert --no-create-info test > /data/test-data-`date +%F`.sql #3、导出数据内容vim /data/test-data-`date +%F`.sqlLOCK TABLES `table10` WRITE;set names utf8; #4、这一行是多加的,自己指定想要转换的字符集INSERT INTO `table10` VALUES (1,'云中鹤');UNLOCK TABLES;mysql> create database if not exists test; #5、创建数据库,存储转换后的数据Query OK, 1 row affected, 0 warning (0.00 sec)mysql -S /tmp/mysql.sock4 test < /data/test-`date +%F`.sql #6、导入表结构mysql -S /tmp/mysql.sock4 test < /data/test-data-2015-09-25.sql #7、导入表数据

最后

这是在15年的时候,自己学习MySQL的笔记,今天再拿出来分享下

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对的支持。


  • 上一条:
    详解MySQL是如何解决幻读的
    下一条:
    Mysql开启慢SQL并分析原因
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 分库分表的目的、优缺点及具体实现方式介绍(0个评论)
    • DevDB - 在 VS 代码中直接访问数据库(0个评论)
    • 在ubuntu系统中实现mysql数据存储目录迁移流程步骤(0个评论)
    • 在mysql中使用存储过程批量新增测试数据流程步骤(0个评论)
    • php+mysql数据库批量根据条件快速更新、连表更新sql实现(0个评论)
    • 近期文章
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • Laravel 11.15版本发布 - Eloquent Builder中添加的泛型(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2017-06
    • 2017-08
    • 2017-09
    • 2017-10
    • 2017-11
    • 2018-01
    • 2018-05
    • 2018-10
    • 2018-11
    • 2020-02
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2020-07
    • 2020-08
    • 2020-09
    • 2021-02
    • 2021-04
    • 2021-07
    • 2021-08
    • 2021-11
    • 2021-12
    • 2022-02
    • 2022-03
    • 2022-05
    • 2022-06
    • 2022-07
    • 2022-08
    • 2022-09
    • 2022-10
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-03
    • 2023-04
    • 2023-05
    • 2023-07
    • 2023-08
    • 2023-10
    • 2023-11
    • 2023-12
    • 2024-01
    • 2024-03
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客