EPC工程师现场(或远端接入)工作守则 一、本文目的 为了给客户提供更好的专业服务,保障网络安全,杜绝人为责任事故的发生,现制定阿朗工程师现场(或远端接入)操作工作守则 二、工作细则 1、充分认识阿朗EPC网络现状。 阿朗EPC网元众多,主要包括MME, GW,SAM,SG,融合APN, PCRF,DNS, 融合CG,LIG 等等,并且结构复杂。任何一网元出现故障,不论是软件还是硬件,都有可能直接或间接地影响网络服务(包括语音呼叫,短信,数据业务,计费传送等),导致客户投诉。所以务必请各职能工程师清楚理解所维护EPC的网络结构,能够正确识别各网元软件版本和硬件实体,坚决避免犯一些低级错误,比如拔错板或走线,走错机柜,错打补丁等故障发生。 所有的版本软件必须通过正常的渠道来申请,使用的版本软件应该是公司正式归档下发的软件; 2、遵守用户和阿朗工作流程。 任何工作,包括补丁,升版,工程改造,数据修改(不论是为了处理投诉,还是为了新业务扩展),硬件更换,均须向用户书面申请,并在与协商得到同意的时段内进行操作;并要求用户提供相应的工程师配合,由其完成工作后的各种验证测试,如发现某些新问题,应查明原因,给客户一个合理的解释并让客户确认。
禁止在行业默许规定时间(一般为00:00至6:00,特殊产品以本产品规定为准)外进行业务割接、数据设定、带电拨插重要单板、加载、关电复位等操作; 割接、重大数据修改或者升级操作前应制定详细的操作技术方案和准备安全倒回措施(重大升级/割接的技术方案必须通过公司相关文件指定权威部门审核后方可实施),操作前必须严格按照方案和数据设定规范进行测试和检查,计费、安全倒换是重点,操作完成以后,要做相应的拨打、联调测试,必须查验所有局向的全部计费情况和话单,割接后应观察一段时间;数据操作前应备份原数据,版本升级操作要备份原版本; 3、正确使用操作指导书。 一般情况下,现场工程师使用阿朗内部的操作指导书制作数据和做相应的软件和硬件操作。现场执行工程师必须完全理解操作指导书所述内容,请注意以下两点:(1) 操作指导书中的相应数据可能与实际现场情况不符,比如:操作指导书中的数据可能来自上海实验室或某FOA局,其数据及有可能与所要操作的局里的情况不同,请仔细比较;同时,由于阿朗软件升级频繁,某些系统表格中数据项可能与操作指导书不符,应以实际内容为主而不应只看数据项的标识。(2) 如果遇到操作指导书中所述不清楚或与实际执行工程师理解不一致,一定要联系操作指导书的作者或联系给你操作指导书的人,把这些疑惑弄清楚,做到不盲目跟从操作指导书,完全理解操作指导书所叙述的内容。 在准备任何触及网络操作的操作指导书时 ,阿朗工程师必须明确了解下述问题: - 是否有控制或防止干扰操作进程的措施?
- 实行操作的时间是否恰当?
- 工单,操作指导书和相关手册是否齐备无误?
- 是否具备万一操作失败时迅速恢复系统原状的措施(容错措施)?
4、养成良好的工作习惯。 切记同一时间只做一件工作,记录工作日志,比如拷屏;在同一台电脑终端上只对同一个局进行操作,如确实需要比较不同网元数据,确认只是比较,而不做任何操作,特别是在夜晚、长时间工作后或紧急情况下;对不同网元的操作,注意数字命令的使用,头脑要清醒地知道所在窗口是哪一个网元,避免由于数字命令用错导致意想不到的问题发生; 系统使用的软盘需要定期杀毒,硬盘中不能有与系统运行无关的程序或数据;主动检查设备运行状态及数据,清除故障隐患; 5、恰当使用SecureCRT,WireShark,SAM 客户端,或其他Call Trace工具。 在日常投诉处理中,我们经常使用一些Call Trace工具。请在使用前查看该工具是否已经在运行,并切记一定要在用完后关闭该工具,以免导致CPU负荷上升发生危险。同时,对于一些消耗内存过多的工具,包括包括备份脚本,做大量数据显示和修改的操作,请最好在话务量低的时间段运行,保证其对服务影响最小。 6、妥善保管各类网元用户名和密码及IP地址。 现在,运营商对用户名和密码特别敏感。一般情况下每个局会给其相应技术支持工程师一个用户名,请妥善保管,不要随意告诉他人。如需使用高权限口令,请向电信申请一个临时的密码,并告知客户你所使用的时间,工作结束后,请电信负责人修改密码。
工程调试工作中,若需要将调试设备(如便携机等)接在主设备所在网络中,必须提前提交现场服务申请向客户申请调测设备IP地址,并得到用户的许可后方可将调试设备(通常是便携机)接入用户主设备的网络; 7、慎重远端接入。 如确实需要,向用户讲明缘由,让用户工程师现场配合,准备好远程接入手段;一般情况下,远端接入最好只是收集数据,如需其他操作,最好请用户工程师执行命令,避免产生责任纠纷。(紧急情况除外) 8、及时反馈工作进展和分享工作经验。 现场工程师应第一时间报告工作进展状况,包括所遇到的问题,解决问题的方法,分享工作经验,使得一些可能发生的隐患由于这些先知得到控制和消除。同时,及时更新操作指导书或类似的文档,以免同类事件再次发生。 9、执行系统倒回。 现场工程师在操作过程中,如发生意外,如升版后,某些测试项不通过或修改某参数后导致意想不到的事情发生,并确实影响到现有业务服务,应立即倒回。要求执行工程师收集命令日志,实施倒回步骤,将影响降低到最小限度。倒回后应重新确认无网络问题影响服务。 10、紧急情况处理。 无论是在现场操作过程中,还是接到客户投诉系统运行出现异常,已经影响到大面积达服务。应沉着冷静,判断出可能的软硬件情况,如果所面临形式已超出自己控制范围,立即寻求技术支持,找到最适合的工程师,否则,打上一级技术支持热线寻求帮助,并通知相关功能的人员,安抚客户,争取在最短的时间内恢复服务。对于任何紧急情况,处理的原则是先恢复服务,再查找原因;任何技 术细节和故障原因的讨论,包括涉及到人为的操作和操作指导书的执行,向用户解释之前必须和上级技术支持部门沟通后达成明确定论,避免凭自己主观推断后向用户做解释和说明。 以上是对工程师在现场操作或远端接入工作时所提出的几点要求,请大家遵照执行。
|