什么是2038问题?

什么是2038问题

不知道你有没有听过2038问题?无论你是否听过,本文将带你认识什么是2038问题

Unix时间戳

定义为从格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数。
而在C语言中,常用time_t来表示。举个例子:

//来源:公众号【编程珠玑】
//作者:守望先生
#include 
#include 
int main (void) 
{
   time_t rawtime = 10;//time(NULL)获取当前时间戳
   struct tm info;
   //转为tm结构
   localtime_r( &rawtime,&info);
   //转为字符串
   printf("时间为: %s\n", asctime(&info));
   return 0;
}

运行结果:

时间为: Thu Jan  1 08:00:10 1970

在这里,我给rawtime设置为10,从打印结果来看也知道是正确的了。(注意,由于我们的时区为东八区,所以得到的时间是八点。)
当然这里的内容暂时不展开,主要关注time_t。

然而实际上,time_t到底是什么?

通常,time_t 直接或者间接
被定义为下面这样:

typedef long time_t

(typedef用法请参考《 一句话帮你理解typedef的用法
》)
我们知道,在32位程序下面,long占用四个字节空间:

//来源:公众号【编程珠玑】
//作者:守望先生
#include
#include 
int main(void)
{
    printf("long size:%zd\n",sizeof(long));
    printf("long max:%ld\n",LONG_MAX);
    return 0;
}

编译运行:

$ gcc -m32 -o main main.c
$ ./main
4
2147483647

可以看到,对于32位程序而言,long的最大值为2147483647。

溢出引发的问题

也就是说,一旦时间戳的值大于四字节的LONG_MAX,time_t将会无法正确存储这个时间戳。
举例来说,最开始的程序编译为32位程序,修改rawtime的值为2147483648,运行结果为(注意,溢出的结果是未定义的):

//来源:公众号【编程珠玑】
//作者:守望先生
#include 
#include 
int main (void) 
{
   time_t rawtime = 2147483648;//time(NULL)获取当前时间戳
   struct tm info;
   //转为tm结构
   localtime_r( &rawtime,&info);
   //转为字符串
   printf("时间为: %s", asctime(&info));
   return(0);
}

然后我们编译运行:

$ gcc -m32 -o main main.c
warning: this decimal constant is unsigned only in ISO C90 [enabled by default]
$ ./main
间为: Sat Dec 14 04:45:52 1901

首先编译的时候也有警告,原因在于2147483649无法使用time_t来表示,我们运行之后,也发现结果出乎我们的意料,它竟然是一个1901年的时间!

2038问题

那这和2038有什么关系呢?
编译为64位程序我们再次运行就会发现:

间为: Tue Jan 19 11:14:08 2038

这个4字节整型表示的时间戳值只能表示到北京时间2038年1月19日11时14分07秒,一旦到了这时间之后, 这些32位程序就可能运行异常
,因为它们无法将此时间正确的识别为2038年,而可能会依个别实现而跳回1970年或1901年。

总结

到此,想必你已经很清楚了。由于在32位程序中,time_t最大值为2147483647,即最多表示到北京时间2038年1月19日11时14分07秒,因此在此之后就会出现异常。
而如果使用64位整型,则可以记录至约2900亿年后的292,277,026,596年12月4日15:30:08,星期日(UTC)。
当然,如果采用无符号整型,这个错误会被延后到 2106 年。到那时,还会有32位的程序在运行吗?
2038问题只是一个引子,实际上在程序中有很多现在不会溢出而将来可能溢出的问题,你会关注吗?