PHP 中文字符串截取函数示例:支持gb2312,gbk,big

前端之家收集整理的这篇文章主要介绍了PHP 中文字符串截取函数示例:支持gb2312,gbk,big前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
下面感兴趣的小伙伴一起来看看吧,支持gb2312,gbk,big三种编码。

chr(0)不是null null是什么都没有,而chr(0)的值是0。表示成16进制是0x00,表示成二进制是00000000 虽然chr(0)不会显示出什么,但是他是一个字符。 当汉字被截断时,根据编码规则他总是要把后边的其他字符拉过来一起作为汉字解释,这就是出现乱码的原因。

而值为0x81到0xff与0x00组合始终都显示为“空” 根据这一特点,在substr的结果后面补上一个chr(0),就可以防止出现乱码了
注: 编码 第一字节 第二字节
gb2312 0xa1-0xf7 0xa1-0xfe
gbk 0x81-0xfe 0x81-0xfe 0x40-0x7e
big5 0xa1-0xf7 0x81-0xfe 0x40-0x7e
其次这个是网上搜索的,支持utf-8编码


/**
 * 中文字符串截取函数支持gb2312,gbk,big
 *
 * @param $len = 19;
 * @param $text = "怎么将新闻的很长的标题显示前面一些字,后面用.....来代替?";
 * @param echo strlen($text)<=$len ? $text : (substr($text,$len).chr(0)."....");
 * @author 编程之家 jb51.cc jb51.cc
 **/
function subString_UTF8($str,$start,$lenth)
{
$len = strlen($str);
$r = array();
$n = 0;
$m = 0;
for($i = 0; $i < $len; $i++) {
$x = substr($str,$i,1);
$a  = base_convert(ord($x),10,2);
$a = substr('00000000'.$a,-8);
if ($n < $start){
if (substr($a,1) == 0) {
}elseif (substr($a,3) == 110) {
$i += 1;
}elseif (substr($a,4) == 1110) {
$i += 2;
}
$n++;
}else{
if (substr($a,1) == 0) {
$r[ ] = substr($str,1);
}elseif (substr($a,3) == 110) {
$r[ ] = substr($str,2);
$i += 1;
}elseif (substr($a,4) == 1110) {
$r[ ] = substr($str,3);
$i += 2;
}else{
$r[ ] = '';
}
if (++$m >= $lenth){
break;
}
}
}
return $r;
} 
// End subString_UTF8; }
// End String

/***   代码来自编程之家 jb51.cc(jb51.cc)   ***/
#由于此函数返回的是一个数组,因此要配合join函数显示字符串:
#join('',subString_UTF8($str,$lenth));
#在页面显示的时候还可以在此语句后面连一个"..."

猜你在找的PHP相关文章