我使用time.clock和time.time在Ubuntu上定时了一段python代码:
clock elapsed time: 8.770 s
time elapsed time: 1.869 s
我知道time.time使用系统时间和time.clock使用处理器时钟.当time.time给出比time.clock更长的经过时间时,这对我来说是有意义的:处理器在整个时间内都没有活动(例如,调用time.sleep的时间).
但是为什么/何时处理器时钟会比系统时间大得多?
附录
我做了一个粗略的测试,使用标准映射计算相同的函数,使用进程池映射和线程池映射.可以理解,进程池速度更快,线程池更慢.更有趣的是:时钟时序小于处理器池的时间,但线程池中的时间更长.
同样,我理解为什么处理器池的时钟时序较少:假设主进程没有做太多事情,只是等待池进程完成.但是为什么线程池的时钟时间更长?任何见解?
结果:
map
time 1738.8
clock 1739.6
mp pool
time 580.1
clock 15.9
thread pool
time 3455.3
clock 5378.9
码:
from time import clock,sleep,time
from multiprocessing.pool import ThreadPool
from multiprocessing import Pool
import random
def f(i):
x = [random.random() for j in range(100000)]
return x[i]
def t(fn):
t0,c0 = time(),clock()
for i in range(10): fn(f,range(16))
print ' time ',round(1000*(time()-t0),1)
print ' clock',round(1000*(clock()-c0),1)
if __name__ == '__main__':
print 'map'
t(map)
pool = Pool(8)
print 'mp pool'
t(pool.map)
pool = ThreadPool(8)
print 'thread pool'
t(pool.map)
最佳答案
如果在多个cpu上执行,cpu时间可能会超过挂起时间.我在Python中没有特别看到这一点,但是在使用C语言的多个线程的时钟函数时我肯定已经看到了这一点,并且可能Python代码只是直接调用这个C函数.
关于“为什么”:你正在以错误的方式思考它.重要的是运行程序的核心数量.如果一个核心在两秒钟的停留时间内运行一秒钟对你有意义,但是如果四个核心在同一时间间隔内每个运行一秒钟会怎样.然后在2秒的待机时间内有4秒的cpu时间.内核考虑了测量所有内核的cpu时间.如果多个核心在同一秒内运行,那么在此期间您将花费多个cpu秒.这是对调度程序很重要的成本测量,并且可能是时钟建立在其上的度量.这可能不是您关心的指标,但这就是它的工作原理.