在PHP5.0 中,simplexml_load_file()是一个很好的读取和处理XML文件的函数,但是在读取和处理中文时会出现乱码,经过研究发现,如果是中文内容,必须经过iconv编码转换,否则显示为乱码,代码如下:
英文正确中文乱码,这个我估计就是编码问题了,后来网上找到了相关文章,如核心如下:
1、如果xml的encoding与文件类型不符,立刻报错
2、simplexml可以处理gbk的XML,即文件内容和encoding都为gbk(ANSI格式)
具体方法如下:$chname = iconv('utf-8','gb2312',$table->param["name"]);
实现将编码为'utf-8'的XML文件内容转换为 gb2312 格式的内容,中文编码采用gb2312格式输出,还有一种办法本人没测试过直接摊贩页面编码转成uft8,代码如下:
- header("Content-type: text/html; charset=utf-8");
- //因为wordpress默认编码是utf-8,但IE默认识别为gb2312,所以用header发一下编码
- $url="http://www.111cn.net";
- $xml = simplexml_load_file($url);
- //载入远程XML文件
- $title=$xml->channel->title;
- //根据节点获取博客标题(不循环)
- echo $title."<br />";
- //如果节点循环了,可以用foreach循环取出
- foreach($xml->channel->item as $item){
- echo $item->title."<br />";
- }
- //循环取出文章标题