我最近继承了一个从大型数据库获取信息的小型
Java程序,进行了一些处理并产生了关于信息的详细图像.原始作者使用单个线程编写代码,然后修改它以允许它使用多个线程.
在代码中,他定义一个常数;
// number of threads public static final int THREADS = Runtime.getRuntime().availableProcessors();
然后,它设置用于创建图像的线程数.
我理解他的理由是线程数不能大于可用处理器的数量,所以设置它的数量,以获得处理器的全部潜力.它是否正确?还是有更好的方式来利用处理器的全部潜力?
编辑:给出一些更多的澄清,正在线程的具体算法会缩放到正在创建的图片的分辨率(每个像素1个线程).这显然不是最好的解决方案.这个算法所做的工作是所有的时间,完全是数学运算,没有锁或其他因素会导致任何给定的线程睡眠.我只想最大化程序cpu利用率来缩短完成的时间.
解决方法
线程很好,但正如其他人所指出的,你必须高度的意识到你的瓶颈.您的算法听起来像容易受到多个cpu之间的缓存争用的影响 – 这是特别令人讨厌的,因为它有潜力打击所有线程的性能(通常你会想到使用多个线程继续处理,同时等待缓慢或高延迟IO操作).
缓存争用是使用多cpu来处理高度并行化算法的一个非常重要的方面:确保考虑到内存利用率.如果您可以构建数据对象,因此每个线程都有自己正在处理的内存,可以大大减少cpu之间的缓存争用.例如,可能更容易拥有大量的int数组,并且有不同的线程在该数组的不同部分上工作 – 但是在Java中,该数组的边界检查将要尝试访问内存中的相同地址,可能导致给定的cpu不得不从L2或L3缓存重新加载数据.
将数据分解为自己的数据结构,并配置这些数据结构,使其成为线程本地(甚至可以更好地使用ThreadLocal – 实际使用OS中的结构来提供cpu可用于优化缓存的保证.
我可以给你的最好的建议是测试,测试,测试.不要对cpu的执行情况做出假设 – 这些天来cpu有巨大的魔法,通常会有违反直觉的结果.还要注意,JIT运行时优化将在这里增加一个额外的复杂层次(也许不错,可能不是).