不可忽视的 PHP 数据精度损失问题

我是架构精进之路,点击上方“关注”,坚持每天为你分享技术干货,私信我回复“01”,送你一份程序员成长进阶大礼包。
 

不知大家在开发过程中有没有常常会遇到数据精度问题呢,类似下面这样的:

<?php
$a = 0.57;
echo intval(floatval($a) * 100);

预期输出结果57,实则

56

。结果可能有点出乎你的意外。

那就会有个疑问?为啥实际输出与预期会存在不同呢?这是PHP语言的bug么?


首先我们要知道浮点数的表示(IEEE 754):

浮点数, 以64位的长度(双精度)为例,会采用1位符号位(E),11指数位(Q),52位尾数(M)表示(一共64位)

  • 符号位:最高位表示数据的正负,0表示正数,1表示负数;
  • 指数位:表示数据以2为底的幂,指数采用偏移码表示;
  • 尾数:表示数据小数点后的有效数字。


看来问题的关键点就在于:
小数的二进制表示可能是个 无限循环小数

我们来看看小数用二进制怎么表示:

乘2取整,顺序排列,即将小数部分乘以2,然后取整数部分,剩下的小数部分继续乘以2,然后取整数部分,剩下的小数部分又乘以2,一直取到小数部分,但是像0.57这样的小数像这样一直乘下去,小数部分不可能为0.有效位的小数用二进制表示却是无穷的。

0.57的二进制表示基本上(52位)是: 0010001111010111000010100011110101110000101000111101

如果只有52位的话,0.57 =》 0.56999999999999995

那这样*100之后,再intval一下, 自然就是56了….


这样,就引出了另一个关键的问题: 舍入


对于二进制, 待处理部分有没有达到前一位的一半,达到就进位,没达到就舍去。(暂且当作 0 舍 1 入)

双精度浮点数能表示多少精度呢?

  • 半精度(16bit):11 位有效数字
  • 单精度(32bit):24 位有效数字
  • 双精度(64bit):53 位有效数字
  • 四精度(128bit):113 位有效数字


可见, 这个问题的关键点就是: 
你看似有穷的小数, 在计算机的二进制表示里却是无穷的

那我们应该如何解决呢?

对于高精度数据操作,建议使用以下函数:

  • bcadd — 将两个高精度数字相加
  • bccomp — 比较两个高精度数字,返回-1, 0, 1
  • bcdiv — 将两个高精度数字相除
  • bcmod — 求高精度数字余数
  • bcmul — 将两个高精度数字相乘
  • bcpow — 求高精度数字乘方
  • bcpowmod — 求高精度数字乘方求模,数论里非常常用
  • bcscale — 配置默认小数点位数,相当于就是Linux bc中的”scale=”
  • bcsqrt — 求高精度数字平方根
  • bcsub — 将两个高精度数字相减


– END –
作者:架构精进之路,专注软件架构研究,技术学习与个人成长,关注并私信我回复“01”,送你一份程序员成长进阶大礼包。


「技术架构精进」专注架构研究,技术分享
Thanks for reading!