php读取mysql乱码,用set names XXX解决的原理分享
先说MysqL的字符集问题。Windows下可通过修改my.ini内的 PHP代码
<div class="codetitle"><a style="CURSOR: pointer" data="53890" class="copybut" id="copybut53890" onclick="doCopy('code53890')"> 代码如下:
<div class="codebody" id="code53890">
[
MysqL] default-character-set=utf8 //客户端的默认字符集
[
MysqLd] default-character-set=utf8 //服务器端默认的字符集
假设我们把两个都设为utf8,然后在
MysqL Command Line Client里面输入“show variebles like“character
set%”;”,可看到如下字符:
<div class="codetitle">
<a style="CURSOR: pointer" data="45604" class="copybut" id="copybut45604" onclick="doCopy('code45604')"> 代码如下: <div class="codebody" id="code45604">
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8
要是我们通过采用UTF-8的
PHP程序从
数据库里读取数据,很有可能是一串“?????”或者是其他乱码。
解决办法是,在连接
数据库之后,读取数据之前,先执行一项
查询“SET NAMES UTF8”,即在
PHP里为
MysqL_query("SET NAMES UTF8"); //该句话一定要放在
数据库服务器连接语句【$connection=
MysqL_connect($db_host,$db_user,$db_psw)or die("连接服务器失败");】之后 即可
显示正常(只要
数据库里信息的字符正常)。 到
MysqL命令行输入“SET NAMES UTF8;”,然
后执行“show variebles like“character
set%”;”,发现原来为latin1的那些变量“character_set_client”、“character_set_connection”、“character_set_results”的值全部变为utf8了,原来是这3个变量在捣蛋。 查阅手册,上面那句等于: SET character_set_client = utf8; SET character_set_results = utf8; SET character_set_connection = utf8; 看看这3个变量的作用:
信息输入路径:client→connection→server;
信息
输出路径:server→connection→results。
换句话说,每个路径要经过3次改变字符集编码。以出现乱码的
输出为例,server里utf8的数据,传入connection转为latin1,传入results转为latin1,utf-8
页面又把results转过来。如果两种字符集不兼容,比如latin1和utf8,转化过程就为不可逆的,破坏性的。 但这里要声明一点,“SET NAMES UTF8”作用只是临时的,
MysqL重启后就恢复默认了。 接下来就说到
MysqL在服务器上的配置问题了。岂不是我们每次对
数据库读写都得
加上“SET NAMESUTF8”,以保证数据传输的编码一致?能不能通过配置
MysqL来达到那三个变量默认就为我们要想的字符集?手册上没说,我在网上也没找到答案。所以,从服务器配置的角度而言,是没办法省略掉那行
代码的。
总结:为了让你的网页能在更多的服务器上正常地
显示,还是
加上“SET NAMES UTF8”吧,即使你现在没有
加上这句也能正常访问。