我的问题是:假设他离开了boobytraps,我如何以尽可能少的停机时间优雅地接管服务器?
以下是详细信息:
>位于地下室服务器场的一台生产服务器;可能是ubuntu服务器9.x,带有grsec补丁(我上次询问管理员时听到的谣言)
>一个内部服务器,包含所有内部文档,文件存储库,维基等.再次,ubuntu服务器,几岁.
假设两个服务器都已修补并且是最新的,所以除非有充分的理由(即可以向上级管理层解释),否则我宁愿不要试图破解我的方式.
生产服务器有几个托管的网站(标准apache-PHP-mysql),一个LDAP服务器,一个ZIMBRA电子邮件套件/服务器,据我所知,一些vmware工作站运行.不知道那里发生了什么.可能一个是LDAP主人,但这是一个疯狂的猜测.
内部服务器有一个内部wiki / cms,一个LDAP从服务器,可以从生产服务器复制凭据,还有一些vmware工作站,以及正在运行的备份.
我可以去服务器场的管理员,指向服务器,告诉他们’sudo关闭该服务器请’,以单用户模式登录并按照我的方式使用它.内部服务器也是如此.不过,这将意味着停工,高层管理人员的不安,旧的系统管理员向我开火说“看到了吗?你不能做我的工作和其他麻烦,最重要的是我不得不失去几个星期的无薪时间.
在频谱的另一端,我可以通过服务器以root用户身份登录,以尝试了解正在发生的事情.有可能引发意外的风险.
我正在寻找中间的解决方案:尽量保持一切正常运行,同时了解正在发生的事情和方式,最重要的是避免触发任何遗留的陷阱.
你有什么建议?
到目前为止,我想到了“练习”内部服务器,断开网络连接,使用live cd重新启动,将根文件系统转储到USB驱动器,然后将其加载到断开连接的隔离虚拟机上,以了解以前的sysadmin方式思考(a-la’认识你的敌人’).可以使用生产服务器获得相同的功能,但完全转储会让人注意.也许我只能以root身份登录,检查crontab,检查.profile是否有任何已启动的命令,转储最后的日志,以及想到的任何内容.
这就是我在这里的原因.任何暗示,无论多小,都将不胜感激.
时间也是一个问题:可能会在几小时或几周内发生触发.感觉好像好莱坞电影之一,不是吗?
(从结束开始)
>全新部署
当然,你不能只关闭服务器,让安装人员做到这一点.
一般过程
>获取备份服务器的预算(备份与数据存储一样)
>创建数据快照并在执行任何操作之前将其放在那里
>由管理层签署!
>收集需求列表(需要维基,谁正在使用VMWare实例,……)
>从管理和
>来自用户
>由管理层签署!
>关闭未列出的服务一周(一次一个服务 – 如果您只想关闭外部服务但仍怀疑它可能仍在同一主机上的应用程序中使用,则iptables可能是您的朋友)
>没反应? – >最终备份,从服务器中删除
>反应? – >与服务的用户交谈
>收集管理层签署的新要求和Geet!
>所有未上市的服务都持续了一个月没有反应? – > rm -rf $service(听起来很糟糕,但我的意思是退役服务)
>获得备用服务器的预算
>一次将一项服务迁移到备用服务
>由管理层签字!
>关闭迁移的服务器(关闭电源)
>找出更多人来尖叫你 – >你刚刚找到了剩菜
>收集新的要求
>再次启动并迁移服务
>重复最后4个步骤,直到没有人跟踪你一个月
>重新部署服务器(并由管理层签署!)
>冲洗并重复整个过程.
>重新部署的服务器是您的新备用服务器
你获得了什么?
>所有服务的清单(为您和管理层)
>文档(毕竟你需要为管理层写下一些东西,为什么不做正确的事情并为你和管理层做点什么)
去过那里,它一点也不好玩:(
为什么需要由管理层签字?
>使问题可见
>确保你不会被解雇
>解释风险的机会
>如果他们不想让你这么做就没关系,但毕竟他们决定在得到足够的投入来判断投资是否值得之后做出决定.
哦,并在开始之前向他们展示整体计划,并对最坏情况和最佳情况下的情况进行一些估计.
如果您没有文档,无论重新部署,都会花费大量时间.没有必要考虑后门,恕我直言,如果你没有文件,滚动迁移是达到一个能为公司创造价值的理智状态的唯一途径.