PHP浮点数的一个常见问题

PHP是一种弱类型语言,这样的特性,必然要求有无缝透明的隐式类型转换,PHP内部使用zval来保存任意类型的数值,zval的结构如下(5.2为例):

PHP;"> struct _zval_struct { /* Variable information */ zvalue_value value; /* value */ zend_uint refcount; zend_uchar type; /* active type */ zend_uchar is_ref; };

上面的结构中,实际保存数值本身的是zvalue_value联合体:

PHP;"> typedef union _zvalue_value { long lval; /* long value */ double dval; /* double value */ struct { char *val; int len; } str; HashTable *ht; /* hash table value */ zend_object_value obj; } zvalue_value;

今天的话题,我们只关注其中的俩个成员,lval和dval,我们要意识到,long lval是随着编译器,OS的字长不同而不定长的,它有可能是32bits或者64bits,而double dval(双精度)由IEEE 754规定,是定长的,一定是64bits.

请记住这一点,造就了PHP的一些代码的”非平台无关性”. 我们接下来的讨论,除了特别指明,都是假设long为64bits

IEEE 754的浮点计数法,我这里就不引用了,大家有兴趣的可以自己查看,关键的一点是,double的尾数采用52位bit来保存,算上隐藏的1位有效位,一共是53bits.

在这里,引出一个很有意思的问题,我们用c代码举例(假设long为64bits):

PHP;"> long a = x; assert(a == (long)(double)a);

请问,a的取值在什么范围内的时候,上面的代码可以断言成功?(留在文章最后解答)

现在我们回归正题,PHP在执行一个脚本之前,首先需要读入脚本,分析脚本,这个过程中也包含着,对脚本中的字面量进行zval化,比如对于如下脚本:

PHP;"> PHP $a = 9223372036854775807; //64位有符号数最大值 $b = 9223372036854775808; //最大值+1 var_dump($a); var_dump($b);

输出:

PHP;"> int(9223372036854775807) float(9.22337203685E+18)

也就说,PHP在词法分析阶段,对于一个字面量的数值,会去判断,是否超出了当前系统的long的表值范围,如果不是,则用lval来保存,zval为IS_LONG,否则就用dval表示,zval IS_FLOAT.

凡是大于最大的整数值的数值,我们都要小心,因为它可能会有精度损失:

PHP $a = 9223372036854775807; $b = 9223372036854775808;

var_dump($a === ($b - 1));

输出是false.

现在接上开头的讨论,之前说过,PHP的整数,可能是32位,也可能是64位,那么就决定了,一些在64位上可以运行正常的代码,可能会因为隐形的类型转换,发生精度丢失,从而造成代码不能正常的运行在32位系统上.

所以,我们一定要警惕这个临界值,好在PHP中已经定义了这个临界值:

当然,为了保险起见,我们应该使用字符串来保存大整数,并且采用比如bcmath这样的数学函数库来进行计算.

另外,还有一个关键的配置,会让我们产生迷惑,这个配置就是PHP.precision,这配置决定了PHP再输出一个float值的时候,输出多少有效位.

最后,我们再来回头看上面提出的问题,也就是一个long的整数,最大的值是多少,才能保证转到float以后再转回long不会发生精度丢失?

比如,对于整数,我们知道它的二进制表示是,101,现在,让我们右移俩位,变成1.01,舍去高位的隐含有效位1,我们得到在double中存储5的二进制数值为:

0/*符号位*/ 10000000001/*指数位*/ 0100000000000000000000000000000000000000000000000000 5的二进制表示,丝毫未损的保存在了尾数部分,这个情况下,从double转会回long,不会发生精度丢失.

我们知道double用52位表示尾数,算上隐含的首位1,一共是53位精度.. 那么也就可以得出,如果一个long的整数,值小于:

2^53 - 1 == 9007199254740991; //牢记,我们现在假设是64bits的long 那么,这个整数,在发生long->double->long的数值转换时,不会发生精度丢失.

关于浮点数，还有一点,就是对于如下的这个常见问题的回答:

PHP;">

为啥输出是57啊? PHP的bug么?

我相信有很多的同学有过这样的疑问,因为光问我类似问题的人就很多,更不用说bugs.PHP.net上经常有人问…

要搞明白这个原因,首先我们要知道浮点数的表示(IEEE 754):

浮点数,以64位的长度(双精度)为例,会采用1位符号位(E),11指数位(Q),52位尾数(M)表示(一共64位).

符号位：最高位表示数据的正负，0表示正数，1表示负数。

指数位：表示数据以2为底的幂，指数采用偏移码表示

尾数：表示数据小数点后的有效数字.

这里的关键点就在于,小数在二进制的表示,关于小数如何用二进制表示,大家可以百度一下,我这里就不再赘述,我们关键的要了解,0.58 对于二进制表示来说,是无限长的值(下面的数字省掉了隐含的1)..

0.58的二进制表示基本上(52位)是: 0010100011110101110000101000111101011100001010001111 0.57的二进制表示基本上(52位)是: 0010001111010111000010100011110101110000101000111101

而两者的二进制,如果只是通过这52位计算的话,分别是:

0.58 -> 0.57999999999999996 0.57 -> 0.56999999999999995

至于0.58 * 100的具体浮点数乘法,我们不考虑那么细,有兴趣的可以看(Floating point),我们就模糊的以心算来看… 0.58 * 100 = 57.999999999

那你intval一下,自然就是57了….

可见,这个问题的关键点就是: “你看似有穷的小数,在计算机的二进制表示里却是无穷的”

so,不要再以为这是PHP的bug了,这就是这样的…..

PHP浮点数的一个常见问题

猜你在找的PHP相关文章