我正在使用Ubuntu 10.04并尝试从Ubuntu repesitory安装Sun Grid Engine.它适用于单机,我可以提交作业等.但我不能让它与任何其他机器一起工作.我添加了另一个执行主机并安装了gridengine-client gridengine-common gridengine-exec,但它无法与master进行通信.我甚至关闭了所有防火墙,以确保它不会导致问题.
当我在主节点上尝试qstat -f时,我得到:
queuename qtype resv/used/tot. load_avg arch states --------------------------------------------------------------------------------- standard@neuron1 BIP 0/0/2 0.04 lx26-amd64 --------------------------------------------------------------------------------- standard@neuron2 BIP 0/0/2 -NA- -NA- au
当我在neuron2节点上重启deamon时,我得到:
error: can't find connection error: can't get configuration from qmaster -- backgrounding
当我尝试从n2(neuron2)节点运行qstat -f时,我得到:
error: commlib error: access denied (server host resolves destination host "n1" as "neuron1") error: unable to contact qmaster using port 6444 on host "n1"
我有两个这台机器的主机名,看起来第一个错误与它有关,但如果它导致这种问题会很奇怪.我试过telnet n1 6444并连接.
有谁知道这里发生了什么?我错过了什么吗?
好的,问题确实是主机名加倍.当我从中删除一个开始工作.我会挖掘它,并试图找到它为什么这样.