今天看了《机械姬》,探讨人工智能话题的电影,豆瓣评分7.5,还是蛮不错的一部电影。影片1:09:29处出现了一段python代码,细看了一下,发现是筛法求质数的python代码,写得非常简练的。
影片里的代码略微有点模糊,我重新打一遍,是下面这个样子的
# @param 电影里的代码之《机械姬》:筛法求质数
# @author 编程之家 jb51.cc|www.jb51.cc
#coding:utf8
import sys
def sieve(n):
#compute primes using sieve eratosthenes
x = [1] * n
x[1] = 0
for i in range(2,n/2):
j = 2 * i
while j < n:
x[j] = 0
j = j + i
return x
def prime(n,x):
#Find nth prime
i = 1
j = 1
while j <= n:
if x[i] == 1:
j = j + 1
i = i + 1
return i-1
x = sieve(10000)
code = [1206,301,384,5]
key = [1,1,2,2]
sys.stdout.write("".join(chr(i) for i in [73,83,66,78,32,61,22]))
for i in range(0,4):
sys.stdout.write(str(prime(code[i],x)-key[i]))
# End www.jb51.cc
代码的最后打印出来下面这个很奇怪的东西,目测是一本书的ISBN,上豆瓣查了一下,是Embodiment and the Inner Life,是关于思维、意识的内容的,和本片的主题息息相关。
ISBN =9780199226559[Finished in 0.1s]
# End www.jb51.cc
重点还是前面的两个函数实现的筛法求质数。首先介绍一下什么是筛法,筛法相传是古希腊的埃拉托斯特尼发明的一种检测素数的算法。筛法的思路非常简单,可以用下面的动图来描述。给定一个范围,首先用2去筛,把所有2的倍数都筛掉,然后再用3筛,用5筛,不断重复下去......
再来看代码
# @param 电影里的代码之《机械姬》:筛法求质数
# @author 编程之家 jb51.cc|www.jb51.cc
def sieve(n): //对n以内的数进行筛选,返回一个长度为n的布尔数组
#compute primes using sieve eratosthenes
x = [1] * n //定义长度为n的布尔数组(实际上电影里用1和0来表示true和false了)
x[1] = 0 //1既不是素数也不是合数,设为0
for i in range(2,n/2)://i从2开始一直到n/2
j = 2 * i //j从2倍i开始
while j < n:
x[j] = 0 //把所有i的倍数筛除
j = j + i //下一个i的倍数
return x //返回数组
def prime(n,x): //求第n个素数,只需要在筛选好的布尔数组中找第n个标记为1的数就可以了
#Find nth prime
i = 1 //初始化为1
j = 1
while j <= n: //在布尔数组中寻找第n个标记为1的数
if x[i] == 1:
j = j + 1
i = i + 1
return i-1 //前面循环中i多加了一次,返回时需要减1
# End www.jb51.cc
可以看到,使用筛法求第n个质数的时间复杂度为O(n),缺点在需要提前求得筛选的结果,增加了空间复杂度,筛选结果可以用比特位来表示以节省空间。
此外还有一个问题,在求第n个质数的时候,如何要确定第n个质数的大致范围,以确定筛选结果的布尔数组长度。根据素数定理,可以用来估算某个范围内的素数个数,可以用公式x/ln(x)来描述,ln表示自然对数,假设要估计10000以内有多少质数,代入公式10000/ln(10000)得到的结果为1085.73,使用上面的筛法得到的10000以为的质数个数为1229,可以看到估计值比实际值略小一点,估计的范围越大,估计值与实际值的误差越小。实际使用中可以通过公式计算估计值,然后按一定百分比扩大范围即可。