我在5个不同国家的10年的每日债券价格数据中运行了termstrc收益率曲线分析包.这是高度计算密集型的,每个国家的标准搭配需要3200秒,如果我在2009年i7 mac上使用foreach和%dopar%(使用doSNOW),则使用所有4个内核(8个超线程),我将其归结为850秒.每当我添加一个国家(计算国内差价)时,我都需要重新分析这一分析,而且我有19个国家将要投入更多的信贷收益曲线.所花费的时间开始看起来像一个主要问题.顺便说一下,问题的termstrc分析函数在R中被访问,但是写在C.
现在,我们是一个12人的小公司(阅读有限的预算),全部配备8GB RAM,i7个PC,其中至少有一半用于平凡的文字处理/电子邮件/浏览风格的任务,也就是使用5%最高的表现.它们都使用千兆位(但不是10千兆位)以太网联网.
我可以使用MPI集中一些这些未充分利用的电脑,并在其中运行我的R分析?网络会受到影响吗?收益率曲线分析函数的每次迭代大约需要1.2秒,所以我假设如果并行处理的粒度是将整个函数迭代传递给每个集群节点,与千兆以太网延迟相比,1.2秒应该是相当大的?
这可以做吗怎么样?对我的同事会有什么影响.在对机器征税时,他们可以继续阅读电子邮件吗?
我注意到,Open MPI似乎不支持@L_301_0@,而MPICH似乎.你会用哪个?
也许在每台电脑上运行Ubuntu虚拟机?