我正在使用SOCK集群和本地计算机上的工作程序运行并行操作.如果我限制我正在迭代的集合(在一次测试中使用70而不是完整的135个任务)那么一切正常.如果我去全套,我得到错误“反序列化错误(socklist [[n]]):从连接读取错误”.
原文链接:https://www.f2er.com/windows/365220.html>我已取消阻止Windows防火墙中的端口(进/出)并允许Rscript / R的所有访问.
>它不能是超时问题,因为套接字超时设置为365天.
>它不是任何特定任务的问题,因为我可以顺序运行(如果我将数据集分成两半并进行两次单独的并行运行,也可以并行运行)
>我能想到的最好的是通过套接字传输的数据太多了.似乎没有集群选项来限制数据限制.
我对如何进行感到茫然.有没有人见过这个问题或者可以建议修复?
这是我用来设置集群的代码:
cluster = makeCluster( degreeOfParallelism,type = "SOCK",outfile = "" ) registerDoSNOW( cluster )
编辑
虽然这个问题与整个数据集有关,但它也会随着数据集的减少而不时出现.这可能表明这不仅仅是数据限制问题.
编辑2
我挖得更深一些,事实证明我的函数实际上有一个随机组件,这使得有时任务会引发错误.如果我按顺序运行任务,那么在操作结束时我会被告知哪个任务失败了.如果我并行运行,那么我会收到“unserialize”错误.我尝试在tryCatch调用中使用error = function(e){stop(e)}包装由每个任务执行的代码,但这也会生成“unserialize”错误.我很困惑因为我认为雪会把它们传回主人来处理错误?