本文实例讲述了PHP实现UTF-8文件BOM自动检测与移除的方法。分享给大家供大家参考。具体实现方法如下:
BOM信息是文件开头的一串隐藏的字符,用于让某些编辑器识别这是个UTF-8编码的文件。但PHP在读取文件时会把这些字符读出,从而形成了文件 开头含有一些无法识别的字符的问题。
比如用UTF-8格式保存的生成图片的PHP文件,因为文件头隐藏的BOM信息也被下发,导致生成的 图片数据不对,浏览器无法识别。
要检测一个UTF-8文件是否含有BOM信息,就是检测文件开头的字三个符,是否为0xEF,0xBB,0xBF。下面这个小程序,用户遍历某个目录下所有文件,并检测是否加了BOM。
$basedir="."; //修改此行为需要检测的目录,点表示当前目录 $auto=1; //是否自动移除发现的BOM信息。1为是,0为否。
//以 下不用改动
if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")."
";
}
closedir($dh);
}
function checkBOM ($filename) { global $auto; $contents=file_get_contents($filename); $charset[1]=substr($contents,1); $charset[2]=substr($contents,1,1); $charset[3]=substr($contents,2,1); if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) { if ($auto==1) { $rest=substr($contents,3); rewrite ($filename,$rest); return ("BOM found,automatically removed."); } else { return ("BOM found."); } } else return ("BOM Not Found."); }
function rewrite ($filename,$data) { $filenum=fopen($filename,"w"); flock($filenum,LOCK_EX); fwrite($filenum,$data); fclose($filenum); }
把下面 代码保存为 bom.PHP 记得保存为 utf8 格式
目录下的检测结果
PHP //此文件用于快速测试UTF8编码的文件是 不是加了BOM,并可自动移除 //By bob 老大 //风吟修改 $目录= str_replace(" ","|",$_POST["dir"]);//接受提交的路径数据 $basedir="$目录"; //修改此行为需要检测的目录,点表示当前目录 $auto=1; //是否自动移除发现的BOM信息。1为是,0为否。 //以下不用改动 if ($dh = opendir($basedir)) { while (($file = readdir($dh)) !== false) { if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file").""; } closedir($dh); } function checkBOM ($filename) { global $auto; $contents=file_get_contents($filename); $charset[1]=substr($contents,$rest); return ("--Bom 已经清除完毕。"); } else { return ("--Bom found."); } } else return ("--没有检查到Bom."); } function rewrite ($filename,$data); fclose($filenum); } ?> 请 输入文件夹名比如 plugin/fanfou 后面不需要加/。如果要检测根目录输入“ . ” . 是小数点 提交既可
希望本文所述对大家的PHP程序设计有所帮助。