什么是2038问题?
什么是2038问题
不知道你有没有听过2038问题?无论你是否听过,本文将带你认识什么是2038问题
Unix时间戳
定义为从格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数。
而在C语言中,常用time_t来表示。举个例子:
//来源:公众号【编程珠玑】 //作者:守望先生 #include #include int main (void) { time_t rawtime = 10;//time(NULL)获取当前时间戳 struct tm info; //转为tm结构 localtime_r( &rawtime,&info); //转为字符串 printf("时间为: %s\n", asctime(&info)); return 0; }
运行结果:
时间为: Thu Jan 1 08:00:10 1970
在这里,我给rawtime设置为10,从打印结果来看也知道是正确的了。(注意,由于我们的时区为东八区,所以得到的时间是八点。)
当然这里的内容暂时不展开,主要关注time_t。
然而实际上,time_t到底是什么?
通常,time_t 直接或者间接
被定义为下面这样:
typedef long time_t
(typedef用法请参考《 一句话帮你理解typedef的用法
》)
我们知道,在32位程序下面,long占用四个字节空间:
//来源:公众号【编程珠玑】 //作者:守望先生 #include #include int main(void) { printf("long size:%zd\n",sizeof(long)); printf("long max:%ld\n",LONG_MAX); return 0; }
编译运行:
$ gcc -m32 -o main main.c $ ./main 4 2147483647
可以看到,对于32位程序而言,long的最大值为2147483647。
溢出引发的问题
也就是说,一旦时间戳的值大于四字节的LONG_MAX,time_t将会无法正确存储这个时间戳。
举例来说,最开始的程序编译为32位程序,修改rawtime的值为2147483648,运行结果为(注意,溢出的结果是未定义的):
//来源:公众号【编程珠玑】 //作者:守望先生 #include #include int main (void) { time_t rawtime = 2147483648;//time(NULL)获取当前时间戳 struct tm info; //转为tm结构 localtime_r( &rawtime,&info); //转为字符串 printf("时间为: %s", asctime(&info)); return(0); }
然后我们编译运行:
$ gcc -m32 -o main main.c warning: this decimal constant is unsigned only in ISO C90 [enabled by default] $ ./main 间为: Sat Dec 14 04:45:52 1901
首先编译的时候也有警告,原因在于2147483649无法使用time_t来表示,我们运行之后,也发现结果出乎我们的意料,它竟然是一个1901年的时间!
2038问题
那这和2038有什么关系呢?
编译为64位程序我们再次运行就会发现:
间为: Tue Jan 19 11:14:08 2038
这个4字节整型表示的时间戳值只能表示到北京时间2038年1月19日11时14分07秒,一旦到了这时间之后, 这些32位程序就可能运行异常
,因为它们无法将此时间正确的识别为2038年,而可能会依个别实现而跳回1970年或1901年。
总结
到此,想必你已经很清楚了。由于在32位程序中,time_t最大值为2147483647,即最多表示到北京时间2038年1月19日11时14分07秒,因此在此之后就会出现异常。
而如果使用64位整型,则可以记录至约2900亿年后的292,277,026,596年12月4日15:30:08,星期日(UTC)。
当然,如果采用无符号整型,这个错误会被延后到 2106 年。到那时,还会有32位的程序在运行吗?
2038问题只是一个引子,实际上在程序中有很多现在不会溢出而将来可能溢出的问题,你会关注吗?