mysql操作命令梳理(4)-中文乱码问题

mysql操作命令梳理(4)-中文乱码问题

大家好,又见面了,我是全栈君。

 

在平时的mysql运维操作中,经常会碰到插入中文字段后出现乱码的情况,产生中文乱码的原因一般有:
1)mysql的编码格式不对,是latin1编码。强烈推荐将mysql下的编码格式都改为utf8,因为它兼容世界上所有字符!
2)mysql的表的语系设定问题(包含character与collation)
3)客户端程式(例如php)的连线语系设定问题

下面就对Mysql下处理数据表中中文字段乱码问题的操作做一记录:
为了防止后续操作出现乱码现象,最好在创建库或数据表的时候就设置正确的编码。
    创建数据库的时候,设置编码格式

mysql> CREATE DATABASE hqsb 
    -> CHARACTER SET utf8 
    -> COLLATE utf8_general_ci;  
Query OK, 1 row affected (0.01 sec)

    创建表的时候,设置编码格式

mysql> use hqsb;
Database changed
mysql>   CREATE TABLE haha (                                                                                                                   
    ->   id int(10) PRIMARY KEY AUTO_INCREMENT,
    ->   name varchar(64) NOT NULL
    ->   ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
Query OK, 0 rows affected (0.02 sec)

这3个设置好了,基本就不会出问题了,即建库和建表时都使用相同的编码格式。

如果在建库建表的时候没有指明编码格式导致中文乱码,可以通过以下方式进行查询。
1)查看mysql系统默认的编码格式(保证下面查询结果中的所有编码格式都是utf8,有不是的就手动修改!):
a)session范围(临时修改,当前窗口有效)
查看数据库编码 

mysql> show variables like "%char%";  
+--------------------------+----------------------------------+
| Variable_name            | Value                            |
+--------------------------+----------------------------------+
| character_set_client     | gbk                             |
| character_set_connection | gbk                              |
| character_set_database   | utf8                             |
| character_set_filesystem | binary                           |
| character_set_results    | gbk                              |
| character_set_server     | utf8                             |
| character_set_system     | utf8                             |
| character_sets_dir       | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)

手动修改字符集(如上,哪一项不是utf8,就修改哪一项):

mysql> SET character_set_filesystem='utf8';  
Query OK, 0 rows affected (0.00 sec)

再次查看是否已修改:

mysql> show variables like "%char%";  
+--------------------------+----------------------------------+
| Variable_name            | Value                            |
+--------------------------+----------------------------------+
| character_set_client     | utf8                             |
| character_set_connection | utf8                             |
| character_set_database   | utf8                             |
| character_set_filesystem | utf8                           |
| character_set_results    | utf8                             |
| character_set_server     | utf8                             |
| character_set_system     | utf8                             |
| character_sets_dir       | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)

如上可以看到字符集已经修改成都是utf8了。但是这里有一个问题,那就是重新打开一个命令窗口然后查看数据编码就又出现上面非utf8的情况。这就需要设置global范围:
b)global范围(临时修改,跨窗口有效)
mysql 设置变量的范围默认是 session 范围。如果设置多个会话的字符集那么需要设置 global 范围:Set [global|session] variables …

mysql> set global character_set_filesystem='utf8';  
Query OK, 0 rows affected (0.00 sec)

mysql> show variables like "%char%";  
+--------------------------+----------------------------------+
| Variable_name            | Value                            |
+--------------------------+----------------------------------+
| character_set_client     | utf8                             |
| character_set_connection | utf8                             |
| character_set_database   | utf8                             |
| character_set_filesystem | utf8                           |
| character_set_results    | utf8                             |
| character_set_server     | utf8                             |
| character_set_system     | utf8                             |
| character_sets_dir       | /usr/local/mysql/share/charsets/ |
+--------------------------+----------------------------------+
8 rows in set (0.01 sec)

当跨会话查看mysql字符集都会看到都是utf8。如果以为这样就万事大吉了的话,那么就大错特错了。
c)设置数据全局范围(全局修改,永久生效)
如上设置后,当数据库重启后,就会发现设置global范围的值又变成latin1了!
修改 mysql 配置文件 /etc/my.cnf

[mysqld]
character-set-server=utf8 
[client]
default-character-set=utf8 
[mysql]
default-character-set=utf8

如上设置后,重启 mysql 服务,就会发现它的字符集就完全变成 utf8了。
不过需要请注意上面这几个参数配置的位置,不然可能会启动不起来 mysql 服务!
这样,后续创建数据库或表的时候不需要指定字符编码,它默认就是 utf8!

Mysql字符集修改的两点总结:
– 直接在session级别设置mysql的字符编码,这是治标不治本的方法;
– 要从源头上解决这个问题。那就是修改 mysql 默认的配置文件,把它的字符集修改成能够使用中文字符的UTF8才行!

2)查看数据库(比如hqsb)的编码格式:

mysql> show create database hqsb;
+----------+---------------------------------------------------------------+
| Database | Create Database                                               |
+----------+---------------------------------------------------------------+
| hqsb     | CREATE DATABASE `hqsb` /*!40100 DEFAULT CHARACTER SET utf8 */ |
+----------+---------------------------------------------------------------+
1 row in set (0.00 sec)

如果数据库的编码格式不正确,可以手动修改:

mysql> ALTER DATABASE hqsb DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;  
Query OK, 1 row affected (0.01 sec)

3)查看数据表(比如haha)的编码格式:

mysql> show create table haha;
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table                                                                                                                                           |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| haha  | CREATE TABLE `haha` (
  `id` int(10) NOT NULL AUTO_INCREMENT,
  `name` varchar(64) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

如果数据表的编码格式不正确,可以手动修改:

mysql> ALTER TABLE haha DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; 
Query OK, 0 rows affected (0.01 sec)

注意:
在客户端(比如xshell)里连接mysql插入数据,最好事先确保编码格式为Utf-8。

关于网页中乱码问题的几点解决办法总结

1)将网站编码设为utf-8。
2)如果网站已运作了好久,并有很多旧数据,不能再更改简体中文的设定,那么建议将页面的编码设为GBK。
GBK与GB2312的区别就在于:GBK能比GB2312显示更多的字符,要显示简体码的繁体字,就只能用GBK。
3)编辑/etc/my.cnf ,在[mysql]段加入default_character_set=utf8;
4)在编写Connection URL时,加上?useUnicode=true&characterEncoding=utf-8参数;
5)在网页代码中加上一个"set names utf8"或者"set names gbk"的指令,告诉MySQL连线内容都要使用utf8或者gbk;

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/108698.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 内存屏障 – MemoryBarrier[通俗易懂]

    内存屏障 – MemoryBarrier[通俗易懂]处理器的乱序和并发执行目前的高级处理器,为了提高内部逻辑元件的利用率以提高运行速度,通常会采用多指令发射、乱序执行等各种措施。现在普遍使用的一些超标量处理器通常能够在一个指令周期内并发执行多条指令。处理器从L1I-Cache预取了一批指令后,就会分析找出那些互相没有关联可以并发执行的指令,然后送到几个独立的执行单元进行并发执行。比如下面这样的代码(假定编译器不做优化):  z

  • css绝对定位的参照物是什么_css 清除上定位

    css绝对定位的参照物是什么_css 清除上定位css绝对定位的重新认知所谓的css绝对定位,就是position:absolute;这里记录一个我的错误认知,就是绝对定位的参照物是内容,还是内容+内边距,我一直以为参照物就是内容,但是实际上参照物是内容+内边距看看下面的事例<!DOCTYPEhtml><html><head><metachars…

    2022年10月25日
  • dubbo之9种rpc协议

    dubbo之9种rpc协议本文章来源于:https://github.com/Zeb-D/my-review,请star强力支持,你的支持,就是我的动力。[TOC]背景只要涉及通信(大多数是进程通信)就需要通信协议,那么可能要将我们眼里的对象(字符流)按照一定的协议进行字节流通信;那么作为有名rpc框架之一dubbo支持的rpc协议是支持多种配置的;Dubbo支持dubbo、rmi、hessian、htt…

  • 上位机plc编程入门_【新手入门】西门子PLC编程入门学习

    上位机plc编程入门_【新手入门】西门子PLC编程入门学习一、S7-200PLC的硬件结构及系统构成、安装与接线学习1、学习什么内容?重点学习什么内容?(1)PLC的硬件结构(2)PLC的系统构成及CPU和模块参数(3)PLC的选型,安装及接线(重点)2、如何进行学习(学练结合)(1)学习S7-200从入门到精通的第一章内容(2)PLC是技术是一门实践性很强的技术,所有需要用于一台PLC,熟悉PLC的硬件结构,练习PLC与外围设备的接线链接。建议使用技…

  • 私域流量辅助工具

    什么是私域流量?私域流量是指从公域、它域(平台、媒体渠道、合作伙伴等)引流到自己私域(官网、用户名单),以及私域本身产生的流量(访客)。私域流量是可以进行二次以上链接、触达、发售等市场营销活动用户数据。  对于企业来说,随着流量红利的耗尽,企业新客增量逐渐达到瓶颈,想要维持业绩增长,挖掘老用户更多价值就成为了很多公司的共识。公域流量获客成本较高,而私域流量则不用付费就能够为品牌带来更多新用户。在私域运营中,品牌往往更注重用户需求,而不是货品,因此,这些新用户在品牌的私域流量用户池中,往往比公域流量的用户更

  • GBDT的原理_gbdt怎么计算特征重要性

    GBDT的原理_gbdt怎么计算特征重要性看了许多GBDT构建特征的资料整理而成,具体资料见Reference。背景1GradientBoosting2GradientBoostingDecisionTree3GBDT应用-回归和分类GBDT构建新的特征思想GBDT与LR融合方案源码内容generateGBDTfeaturesgeneratefeaturesforFFMPython

    2022年10月12日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号