最近我一直在研究使用Beanstalkd和
PHP.我已经学到了很多关于服务器上的设置等问题.
这是我如何看待它:
>我在ubuntu服务器上安装Beanstalkd和任何依赖项(如libevent).然后我启动Beanstalkd守护进程(应该基本上始终运行).
>在我的网站某处(例如用户执行某些操作等),任务会被添加到Beanstalkd队列中的各种管道中.
>我有一个bash脚本(如下面的一个)作为deamon运行,基本上执行一个PHP脚本.
#!/bin/sh PHP worker.PHP
4)工作脚本将具有这样的执行排队的任务:
while(1) { $job = $this->pheanstalk->watch('test')->ignore('default')->reserve(); $job_encoded = json_decode($job->getData(),false); $done_jobs[] = $job_encoded; $this->log('job:'.print_r($job_encoded,1)); $this->pheanstalk->delete($job); }
现在这里是基于上述设置的问题(如果我错了就更正我):
说我有将RSS Feed导入到数据库中的任务.如果10位用户一次就这样做,他们都将在“测试”管中排队.然而,他们只能一次执行一个.有10个不同的管全部同时执行会更好吗?
>如果我需要更多的管,那么这也意味着我需要10个工作脚本?一个用于每个管,所有的运行与基本相同的代码,除了在watch()函数中的字符串字面值.
>如果我将该脚本作为守护进程运行,那该如何工作?它会不断地执行worker.PHP脚本?那个脚本循环直到队列在理论上是空的,那么它不应该只被一次启动?守护进程如何决定执行worker.PHP的频率?这只是一个设置?
谢谢!
>如果工作人员不要花太多时间来取食饲料,那就没关系了.如果需要,您可以一次运行多个工作人员.我有一个系统(目前使用的是Amazon SQS,但之前我已经和BeanstalkD相似),最多可以有200名(或更多)员工从队列中抽出.
>单个工作脚本(同一脚本运行多次)应该很好 – 脚本可以同时观看多个管,第一个可以保留.您还可以使用job-stat命令来查看特定的$作业来自哪个管理器(或哪个管道)),或者如果需要从其他类型中分配每个类型,则将某些元信息放入消息中.
>运行一个工作人员的一个很好的例子是 described here.我还添加了 supervisord(也是一个 useful post开始),以便轻松启动并持续运行每台机器的一些工作人员(我运行shell脚本,如 first link).我会限制它循环的次数,并且将一个数字放入reserve()以使其等待几秒钟或更长时间,使下一个可用的工作不会在紧密循环中失去控制不要停顿 – 即使没有任何事情.
>单个工作脚本(同一脚本运行多次)应该很好 – 脚本可以同时观看多个管,第一个可以保留.您还可以使用job-stat命令来查看特定的$作业来自哪个管理器(或哪个管道)),或者如果需要从其他类型中分配每个类型,则将某些元信息放入消息中.
>运行一个工作人员的一个很好的例子是 described here.我还添加了 supervisord(也是一个 useful post开始),以便轻松启动并持续运行每台机器的一些工作人员(我运行shell脚本,如 first link).我会限制它循环的次数,并且将一个数字放入reserve()以使其等待几秒钟或更长时间,使下一个可用的工作不会在紧密循环中失去控制不要停顿 – 即使没有任何事情.
附录:
> shell脚本将根据需要运行多次. (链接显示如何根据需要重新运行exec $@).每当PHP脚本退出时,它都会重新运行PHP.>显然有一个Djanjo应用程序显示一些统计信息,但它是微不足道的连接到守护进程,获取一个管子列表,然后获取每个管的统计数据 – 或者只是计数.