电影里的代码之《机械姬》:筛法求质数

原文出处: Keybord_dancer   

今天看了《机械姬》,探讨人工智能话题的电影,豆瓣评分7.5,还是蛮不错的一部电影。影片1:09:29处出现了一段python代码,细看了一下,发现是筛法求质数的python代码,写得非常简练的。先贴个电影的截图:

影片里的代码略微有点模糊,我重新打一遍,是下面这个样子的

Python

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
#coding:utf8
import sys
 
def sieve(n):
    #compute primes using sieve eratosthenes
    x = [1] * n
    x[1] = 0
 
    for i in range(2,n/2):
        j = 2 * i
        while j < n:
            x[j] = 0
            j = j + i
    return x
 
def prime(n,x):
    #Find nth prime
    i = 1
    j = 1
    while j <= n:
        if x[i] == 1:
            j = j + 1
        i = i + 1
    return i1
 
x = sieve(10000)
 
code = [1206,301,384,5]
key = [1,1,2,2]
 
sys.stdout.write(“”.join(chr(i) for i in [73,83,66,78,32,61,22]))
 
for i in range(0,4):
    sys.stdout.write(str(prime(code[i],x)key[i]))


代码的最后打印出来下面这个很奇怪的东西,目测是一本书的ISBN,上豆瓣查了一下,是Embodiment and the Inner Life,是关于思维、意识的内容的,和本片的主题息息相关。

1
ISBN =9780199226559[Finished in 0.1s]


重点还是前面的两个函数实现的筛法求质数。首先介绍一下什么是筛法,筛法相传是古希腊的埃拉托斯特尼发明的一种检测素数的算法。筛法的思路非常简单,可以用下面的动图来描述。给定一个范围,首先用2去筛,把所有2的倍数都筛掉,然后再用3筛,用5筛,不断重复下去……

再来看代码

Python

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
def sieve(n):             //n以内的数进行筛选,返回一个长度为n的布尔数组
    #compute primes using sieve eratosthenes
    x = [1] * n         //定义长度为n的布尔数组(实际上电影里用10来表示truefalse了)
    x[1] = 0            //1既不是素数也不是合数,设为0
 
    for i in range(2,n/2)://i2开始一直到n/2
        j = 2 * i    //j2i开始
        while j < n:
            x[j] = 0  //把所有i的倍数筛除
            j = j + i //下一个i的倍数
    return x          //返回数组
 
def prime(n,x):   //求第n个素数,只需要在筛选好的布尔数组中找第n个标记为1的数就可以了
    #Find nth prime
    i = 1    //初始化为1
    j = 1
    while j <= n:   //在布尔数组中寻找第n个标记为1的数
        if x[i] == 1:
            j = j + 1
        i = i + 1
    return i1    //前面循环中i多加了一次,返回时需要减1

可以看到,使用筛法求第n个质数的时间复杂度为O(nlog(n)),缺点在需要提前求得筛选的结果,增加了空间复杂度,筛选结果可以用比特位来表示以节省空间。

此外还有一个问题,在求第n个质数的时候,如何要确定第n个质数的大致范围,以确定筛选结果的布尔数组长度。根据素数定理,可以用来估算某个范围内的素数个数,可以用公式x/ln(x)来描述,ln表示自然对数,假设要估计10000以内有多少质数,代入公式10000/ln(10000)得到的结果为1085.73,使用上面的筛法得到的10000以为的质数个数为1229,可以看到估计值比实际值略小一点,估计的范围越大,估计值与实际值的误差越小。实际使用中可以通过公式计算估计值,然后按一定百分比扩大范围即可。

3
7 收藏

评论





转载自演道,想查看更及时的互联网产品技术热点文章请点击http://go2live.cn