在window中调试的时候我们可以通过启动多个cmd窗口运行Erlang节点,在生产环境中我们需要Erlang服务在Centos服务器上后台运行;这就需要在启动的时候添加启动参数detached来脱离终端:

-detachedStarts the Erlang runtime system detached from the system console. Useful for running daemons and backgrounds processes. Implies -noinput.

对于我们自己的服务,即使部署到了生产环境一定要做到"像魔术师的飞刀,出手但并没有脱手",还是需要一些方式进入到Erlang后台进程来做一些工作比如:查看某一个Erlang节点的运行时信息(内存,进程数等),让服务优雅的退出而不是kill进程,或者做一下热更新(参见:@L_502_6@当然热更新可以使用reloader.erl的方案来简化);一开始的时候服务器比较少,我们采用的是JCL的方式去处理的;

Erlang Shell JCL

JCL是Erlang Shell的一种运行模式,即Job Control Mode (JCL,in which jobs can be started,killed,detached and connected).我们启动两个节点来完成这个操作;

2012-11-14新增备注:下面的实验是在Linux下完成的,Windows下JCL需要启动werl.exe

Node_1添加了-detached选项,启动之后直接在后台运行并没有启动Shell
erl -setcookie abc -name node_1@192.168.1.123 -detached
Node_2使用了和Node_1相同的cookie,启动之后进入Erlang Shell界面
erl -setcookie abc -name node_2@192.168.1.123
下面我们开始在node_2@192.168.1.123演练JCL:

Eshell V5.9  (abort with ^G)
(node_2@192.168.1.123)1> node().    %当前这是在node_2
'node_2@192.168.1.123'
(node_2@192.2>                %Ctrl + G 进入JCL模式
User switch command
--> h  
  c [nn]            - connect to job
  i [nn]            - interrupt job
  k [nn]            - kill job
  j                 - list all jobs
  s [shell]         - start local shell
  r [node [shell]]  - start remote shell
  q        - quit erlang
  ? | h             - this message
--> rnode_1@192.168.1.123'                           %尝试连接到node_1@192.123  
--> j
   1  {shell,[init]}                                          %列出所有的Job
   2* {',[]}
--> c 2                                                               %这里2是job的编号,切换到job 2 
Eshell V5.9  (abort with ^G)
(node_1@192.1> node().                %注意提示符,现在已经是在node_1
'
(node_1@192.2> erlang:now().
{1326,801888,128); line-height:1.5!important">347570}
(node_1@192.3>                             %再一次Ctrl + G
User switch command                                   
--> j                                                                   
   1                                                               %切换到job 1
(node_2@192.2> node().                %注意提示符,我们已经回到了node_2
3> 

这样来来回回切换是不是有点盗梦空间的意思?是不是可以更简单一点,比如直接进入node_1呢?借助-remsh参数就可以做到

看看-remsh的说明恰好是我们需要的:

If you want an Erlang node to have a remote job active from the start (rather than the default local job),you start Erlang with the -remsh flag. Example: erl -sname this_node -remsh other_node@other_host

动手试一下:
erl -setcookie abc -name node_3@192.168.1.123 -remsh node_1@192.168.1.123 %%这样就直接进入了node_1节点
注意:直接进入到了node_1,执行完操作了想要退出怎么办?你要是在这里执行一下q(). node_1这个节点就直接死掉了;
正确的方法还是Ctrl+G进入JCL模式然后执行q命令退出;使用ps aux|grep node查看一下进程是不是还在

ejabberd网站上提到了这个方法
[1] Attach an Erlang Shell to an Already Running ejabberd Process http://www.ejabberd.im/tricks
[2] Interconnecting Erlang Nodes http://www.ejabberd.im/interconnect-erl-nodes

另一种实用的接入erlang控制台的方法

地址:http://mryufeng.iteye.com/blog/362394 Powered bymryufeng

按照mryufeng老大的方法操练了一番,成功,中间 /usr/local/lib/erlang/bin/start 启动失败,同样是目录和配置文件缺失的问题
mkdir /usr/local/lib/erlang/log
echo "[]." > /usr/local/lib/erlang/releases/R15B/sys.config

Stackoverflow的相关问题: How to create deamon program with erlang? http://stackoverflow.com/questions/5972811/how-to-create-deamon-program-with-erlang

题外话:在embedded模式下是没有交互式shell可用的,能够接入Erlang VM的方法就是to_erl

原理见下图:

erl_call

随着服务器增多,登录一台台服务器然后使用JCL去做热更新之类的就有点麻烦了,取而代之的解决方案就是ssh登录到每台服务器然后向该服务器上的Erlang节点发送消息,执行热更新(当然不限于热更新了);
这里有一个很强大的工具可以用:erl_call;erl_call模块的设计目标就是使用Unix Shell脚本与分布式Erlang节点进行交互,erl_call可以启动或者连接到一个分布式的Erlang节点进行简单的方法调用甚至执行表达式序列;erl_call构建在erl_interface之上,通过标准的RPC调用方式与Erlang的rex server交互,并不需要额外的工具支持.注意Erlang节点的RPC服务启动的时候注册的名字是rex http://www.google.com/codesearch#dNzC48WMK6w/lib/kernel/src/rpc.erl&q=rpc%20lang:erlang&type=cs
看一下erl_call的帮助,注意Erlang版本不同erl_call的路径也有所不同:
Usage: /usr/local/lib/erlang/lib/erl_interface-3.7.6/bin/erl_call [-[demqrsv]] [-c Cookie] [-h HiddenName]
[-x ErlScript] [-a [Mod [Fun [Args]]]]
(-n Node | -sname Node | -name Node)

where: -a apply(Mod,Fun,Args) (e.g -a 'erlang length [[a,b,c]]'
-c cookie string; by default read from ~/.erlang.cookie
-d direct Erlang output to ~/.erl_call.out.<Nodename>
-e evaluate contents of standard input (e.g echo "X=1,Y=2,{X,Y}."|erl_call -e ...)
-h specify a name for the erl_call client node
-m read and compile Erlang module from stdin
-n name of Erlang node,same as -name
-name name of Erlang node,expanded to a fully qualified
-sname name of Erlang node,short form will be used
-q halt the Erlang node (overrides the -s switch)
-r use a random name for the erl_call client node
-s start a new Erlang node if necessary
-v verbose mode,i.e print some information on stderr
-x use specified erl start script,default is erl
简单翻译一下:
-a 执行erlang:apply/3,需要提供的就是m f a,m是必须的,f默认值start,a默认值[],注意这个flag只接受一个参数,所以最好通过添加括号把m f a组织起来.
-c 执行cookie值如果没有指定就会使用~/.erlang.cookie文件中定义的cookie,Erlang 节点之间通信必须要有相同的cookie
-d 调试模式;所有的IO都会输出到~/.erl_call.out.Nodename文件,其中NodeName就是我们要处理的erlang节点名;
-e读一系列的Erlang表达式并返回最后一个表达式的结果,这些表达式用','分隔,'.'结束,这个Erlang Shell是一致的,Ctrl+D组合键结束输入,如果成功返回结果{ok,Result}.
-hHiddenName隐藏erl_call代表的节点
-m读入并编译一个module
-n-name-sname这三个参数三选一,name和n是同样的含义是为了兼容依然保留,sname代码名称
-q停止Erlang 节点
-r为erl_call生一个随机name
-s必要的话启动一个Erlang的分布式节点,意思是自由第一个调用会启动一个Erlang节点后续的调用就会快很多.
-v多打印一些冗余信息
-x ErlScript:指定Erlang启动脚本如果不指定就是用erl start-up脚本
比如我们现在要获取节点node_1的内存信息
/usr/local/lib/erlang/lib/erl_interface-3.7.6/bin/erl_call -s -a 'erlang memory ' -name node_1@192.168.1.123 -c abc
实践中遇到两个问题:
问题一:当name里面包含ip地址的时候执行会报错,这个erlang论坛里面有人也提到了:
erl_call can now use an IP address for remote node name http://erlang.org/pipermail/erlang-patches/2010-October/001533.html
我的解决方案就是把name换成了sname并去掉了ip地址就OK了;
问题二:在使用-e参数的时候怎么结束掉输入并查看结果
这个问题的确挺二的,就因为没有仔细阅读文档,结束的时候需要用Ctrl+D,http://www.erlang.org/doc/man/erl_call.html
/usr/local/lib/erlang/lib/erl_interface-3.7.6/bin/erl_call -e -name node_1@192.168.1.123 -c abc
A=1,
B=2,
C=A+B.
%Ctrl + D
{ok,3}

SSH

如果是在没有Erlang的机器接入怎么办?使用ssh即可,直接关闭SSH即可正常退出,如果接入有问题可以添加-oLogLevel=DEBUG 输出debug信息看一下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
$ mkdir /tmp/ssh
$ ssh-keygen -t rsa -f /tmp/ssh/ssh_host_rsa_key
$ ssh-keygen -t rsa1 -f /tmp/ssh/ssh_host_key
$ ssh-keygen -t dsa -f /tmp/ssh/ssh_host_dsa_key
$ erl
1> application:ensure_all_started(ssh).
{ok,[crypto,asn1,public_key,ssh]}
2> ssh:daemon(8989,[{system_dir, "/tmp/ssh" },
2> {user_dir,monospace!important; min-height:auto!important; color:blue!important">"/home/ferd/.ssh" }]).
$ ssh -p 8989 ferd@127.0.0.1
Eshell Vx.x.x (abort with ^G)
1>

  

有了这些方法,我们可以方便的了解和控制运行中的Erlang节点,洋溢着幸福感啊!
各位春节快乐!!!