49文章网www.wz49.cn提供了丰富的唯美、励志、伤感、正能量等经典文章.如果你需要找名人名言、诗词名句、好词好句等,相信在这里能够找到想要的。

应急服务方案

分类:唯美句子浏览量:55发布于:3年前 作者:句子迷

以下为《应急服务方案》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

第二部分 应急服务方案(一)

技术服务响应和流程

(1)客户:通过电话向XX公司服务人员发出紧急服务请求。紧急服务请求中需描述故障的情况,如地点、时间、详细的故障现象等信息。

(2)XX公司:记录紧急服务请求的客户信息、设备信息、故障现象、局名、时间等内容,输入客户问题管理系统,系统将给该问题分配一个唯一的客户问题受理单号。

(3)XX公司:在紧急故障排除服务等级规定的响应时间内转到工程师确认。在确认后立即通知各产品负责人和当地办事处***,成立紧急恢复故障处理小组,同时进行电话支持和远程支持,并立即派工程师赴机房提供紧急技术支持。XX公司现场紧急服务工程师尽快到达服务现场,记录修复工作开始时间,并开始修复工作:记录发生的所有事件及采取的所有行动;在到达现场后的承诺时间内未能成功恢复通信时,请求网络总部提供支持/逐步升级;准备所有有关数据。当系统恢复正常的工作状态后,记录下修复工作的完成时间。填写设备现场技术服务报告,双方签字确认。

(4)XX公司:系统恢复正常状态后,结束紧急故障排除服务,服务结束后视情况双方协商决定是否安排工程师现场观察1-2天。并且XX公司工程师给出“现场技术服务报告”详细描述故障现象和处理过程,经客户负责人与XX公司工程师签字确认,由客户和XX公司共同备案。

(5)客户:对现场技术服务报告记录和服务存在争议时,由双方进行协商、调查。 客户接收XX公司递交的现场技术服务报告后在下一个工作日内予以确认,如未按时确认并回复,视作已确认。

故障等级和服务响应定义

故障等级约定

佛***根据各项运维服务针对不同的问题级别在服务等级和服务承诺上存在不同的标准,对设备问题的严重程度和影响程度的不同,问题分类为四级。当故障没有在规定时限内恢复或解决时,故障级别将自动升级。

服务请求等级定义如下:

一级故障

定义:系统功能完全丧失,不能继续工作,问题的解决对业务至关重要,情况紧急,不管处于任何时间或日期,需要立即采取纠正措施。

特点:故障具有以下一个或多个特点:

数据损毁;

系统不确定挂起,造成不可接受或不确定的资源或响应延误;

关键业务中断30分钟以上;

系统宕机,重启动之后仍无法正常工作。

二级故障:

定义:系统功能出现问题,有限的情况下仍可继续操作,需要根立即给予关注。该类问题紧急度低于一级问题是因为,对于系统性能、功能,有较少的立即发生或将要发生的影响。

特点:二级服务请求具有以下一个或多个特点:

任何对系统容量/通信量的测量功能的降低;

任何系统功能方面的可见能力和/或诊断能力的丧失;

短暂的中断,如系统或子系统的,在任何24小时中累计时间超过1小时的中断,或更长期内持续重复的中断;

一级数据信号或更高级别的连接的质量的持续降低;

例行业务管理受阻;

进行维护或紧急修复活动的能力的降低;

系统关键或重要故障告警能力的降低;

三级故障:

定义:系统运行中出现影响系统功能和性能的故障,但关键业务不受影响的故障。

特点:三级服务请求具有以下一个或多个特点:

系统性能或系统功能部分退化;

没有替代的解决方案。

四级故障:

定义:指系统在运行中出现的系统功能和性能影响不大,关键业务不受影响的故障。

特点:四级服务请求具有以下一个或多个特点:

系统日志满;

系统备份异常;

空间增加等等;

日常疑惑。

响应机制和服务模式

佛***技术采用平战结合的工作模式,把预防性技术服务和突发性技术服务结合起来,以便最大限度地保证技术服务的及时性和前瞻性。

预防性技术服务主要为系统在日常正常运行的情况下进行的日常技术服务、巡检服务、预防性检查、系统升级、系统补丁、技术交流、新技术咨询服务、技术培训、新系统上线、系统迁移和系统优化技术服务等等。

突发性技术服务是在预防性技术服务过程中产生的小概率事件应对技术支持服务,主要包括:系统瘫痪(宕机)、关键业务数据丢失。

一级故障(重大故障):

指客户遇到系统出现严重影响系统可用性(如:停机、系统紊乱)或者出现系统已经全部瘫痪等无法正常运行时间超过30分钟或使用产品造成的对人身安全的危害的一级问题,通过电话、邮件或传真向XX公司寻求技术支持和帮助,XX公司确认用户的服务请求后,XX公司工程师将启动应急预案以最短的时间进行系统恢复。

XX公司7X24小时受理一级问题紧急排除服务请求。

紧急恢复服务包括紧急电话支持服务、紧急远程接入支持服务和紧急现场支持服务。

如果出现系统连续中断时间超过60分钟的紧急情况,客户和网络服务人员在事后成立故障调查小组对事件展开深入调查。

出现紧急情况时,无论是正常工作时间或非正常工作时间,XX公司服务***必须在确认后立即派工程师进行电话支持和远程支持,同时派工程师赴现场提供现场紧急技术支持;XX公司服务人员负责协调电话支持工程师、远程支持工程师和现场支持工程师的工作关系。

电话响应时间:< 20分钟;

远程接入响应时间:< 30分钟;

紧急故障恢复时间:< 3小时;

解决方案提供时间:3天,达到80%比例;7天,达到100%比例;

分析报告提供时间:5天。

二级故障(严重故障):

指值班工程师监测到系统出现问题,通过电话、邮件或传真向运维工程师寻求技术支持和帮助,运维工程师确认服务请求后,将启动应急预案以最短的时间进行系统恢复。

XX公司7X24小时受理二级问题紧急排除服务请求。

紧急恢复服务包括紧急电话支持服务、紧急远程接入支持服务和紧急现场支持服务。

出现紧急情况时,无论是正常工作时间或非正常工作时间,XX公司服务***必须在确认后立即派工程师进行电话支持和远程支持,同时派工程师赴现场提供现场紧急技术支持;XX公司服务人员负责协调电话支持工程师、远程支持工程师和现场支持工程师的工作关系。

电话响应时间:< 20分钟;

远程接入响应时间:< 30分钟;

紧急故障恢复时间:< 8小时;

解决方案提供时间:3天,达到80%比例;7天,达到100%比例;

分析报告提供时间:5天。

三级故障(重要故障):

指值班工程师监测到系统出现问题,通过电话、邮件或传真向运维工程师寻求技术支持和帮助,运维工程师确认服务请求后,将启动应急预案以最短的时间进行系统恢复。

XX公司7X24小时受理三级问题紧急排除服务请求。

紧急恢复服务包括紧急电话支持服务、紧急远程接入支持服务和紧急现场支持服务。

出现紧急情况时,无论是正常工作时间或非正常工作时间,XX公司服务***必须在确认后立即派工程师进行电话支持和远程支持,同时派工程师赴现场提供现场紧急技术支持;XX公司服务人员负责协调电话支持工程师、远程支持工程师和现场支持工程师的工作关系。

电话响应时间:< 20分钟;

远程接入响应时间:< 30分钟;

紧急故障恢复时间:< 24小时;

解决方案提供时间:3天,达到80%比例;7天,达到100%比例;

分析报告提供时间:5天。

四级故障(日常故障):

工程师30分钟内响应,技术专家1小时响应。

服务范围和服务内容

技术服务范围为:咨询、规划、安装、调优、巡检、应急处置等等所提供产品的技术服务工作。

具体服务内容如下:

服务内容

服务交付成果

频率/数量



咨询服务

对于系统功能使用、说明等提供咨询

不限次数



电话支持服务

对于系统简单问题,提供电话支持服务。

不限次数



现场技术服务

对于电话支持无法解决的问题,派工程师到现场解决问题。





远程紧急救援

对于核心系统上出现的1-4级问题,提供24*7的方式,以远程单点接入的方式提供最快响应的紧急救援服务。

根据需要,不限次数



现场紧急救援

对于一级严重问题,在初步判断故障后以最快速度派出工程师提供现场服务,以加快问题的解决。

在服务结束后,工程师将提供现场服务报告。





性能检查及配置检查

针对系统的稳定运行及高可用性,检查并提供分析与建议。

针对相关硬件及软件环境中的配置提出建议。

提供性能及配置检查报告





升级和数据迁移服务

针对用户系统升级提供数据库系统升级技术服务;

对于信息系统或系统移动造成的数据迁移提供数据迁移服务。





备份恢复

备份恢复策略制定服务;

系统演习;





巡检服务

给用户提供定期巡检服务,以消除潜伏期的缺陷,降低系统故障率





咨询与方案建议

给用户提供最新技术资料和技术交流,并根据实际需求提供咨询和解决方案





培训服务

给提供网络系统和应急广播平台系统管理员培训





文档管理服务

给用户提供文档管理服务,每项服务均生成响应服务模块的技术文档,这些文档是用户系统健康状况数据,用户根据这些文档可以理解和管理自己的系统

合同保密协议周期内全程提供,不限次数



定义

受理时间:指XX公司响应中心通过电话、EMAIL、传真等各种方式受理客户请求的时间;

响应时间:指最初接到客户服务请求到XX公司工程师通过电话向客户确认服务请求的时间;

到达现场时间:指XX公司工程师从受理客户服务请求开始,到达双方协议约定的故障处理现场为止的时间;

紧急故障恢复时间:从建立起一个有效的客户服务请求(指此客户服务请求已包含所有必要信息)到故障恢复时间(消除了问题产生的影响但可能使系统在运行上存在某些限制,或导致客户服务请求的问题只能以在未来才能提供的软件升级得以永久解决,此时恢复方案只是一个临时解决办法)。

解决方案提供:指XX公司受理和响应了客户服务请求以后,给客户提供可行的解决问题和故障的方案(确使问题或产生问题的原因不再发生并使系统恢复到问题发生前的正常工作状态),不包含方案的实施。

咨询服务

技术咨询一般能够根据网能的技术文件提供解答,而不需作进一步的技术调查。

XX公司提供5X8(周一至周五,早上8:30-12:00、下午13:30-18:00,国家法定节假日除外)的电话咨询服务,服务的响应时间承诺≤2小时。

电话咨询服务仅限于对产品功能使用、说明等咨询,不涉及电话指导技术操作。

电话支持服务

服务内容概述:

电话支持服务是佛***技术支持的重要手段。针对一般性问题,佛***提供7XXXXX24小时响应的热线服务电话。对于用户提交的技术问题和一般性故障问题能够作出及时响应。对于用户提交的严重性故障问题,响应时限应在30分钟以内。

对于用户提出的电话请求都进行详细登记,并指派相应的技术工程师跟踪解决。

为保证对用户服务需求的响应时间,佛***一年365 天全天候安排至少2名资深工程师7 x 24 小时值班,配备专用值班手机;非值班人员(工程师、项目经理)公司要求7 x12 小时(包括节假日,8:30  20:30)必须开手机,特殊情况下如果不宜接听手机,要求工程师也不得关机并且在2 小时内必须给与回电;值班工程师接到用户求救电话后立即进行问题处理,同时通知项目经理和部门值班经理,以便协调其它工程师或为到现场救援做好准备。

佛***工程师回答用户日常来电,每月电话询访用户,向用户了解硬件、系统软件及操作等方面的运行状况,回答系统日常运行过程中的有关问题,以及安排下一步的服务。

服务交付成果:

电话记录和用户问题处理报告。

意义:

通过电话支持实现简单问题解决;同时,通过电话支持及时响应用户重大系统故障的响应,及时配置有效资源排除用户重大系统故障。

现场技术服务

服务内容概述:

对于通过电话支持和原厂家远程支持都不能解决的故障,佛***协调经验丰富的原厂技术支持工程师到现场分析故障原因,制定故障解决方案,并最终排除故障。

准备工作:

查阅“用户档案”,了解用户系统相关参数、配置、运行情况及系统以往所发生过的问题及处理办法,根据用户审告描述立即举行解决方案网络会议、确定故障等级以及启动相应预案;

准备技术服务工具(故障诊断工具和其他系统诊断工具)、技术服务资料、交通工具。

现场工作:

到现场以后,了解系统运行情况,核实故障现象,并根据故障现象对系统进行故障分析、测试、诊断,并制定业务恢复和故障解决技术方案。 佛***保证优先实施业务恢复,在恢复业务的前提下,再进行彻底的故障修复。

在处理故障时不能影响到系统的正常运行,并与用户维护人员在场协同处理;在必须进行系统重装或系统启动等较大操作时,须经用户维护主管部门批准方可实施。

若因佛***工程师误操作或擅自行事等主观原因给用户带来的损失,由佛***承担损失。

在处理故障后,向用户维护人员解释故障原因和解决方法,以及在日常维护中的预防措施。

在处理故障时,要认真填写《故障处理报告》,并在离开现场前交用户主管部门存档,同时加入佛***的用户故障处理台账。

服务交付成果:

现场技术支持报告

现场问题报告

故障处理报告

意义:

通过现场服务贴近故障实际,加快问题解决,保证系统问题得到及时解决。

远程紧急救援

服务内容概述:

用户通过电话技术热线提交所遇到的问题,佛***24小时值班工程师对于问题进行分类,把故障级别为一、二两级的服务,直接转发给技术服务总监那里,技术服务总监根据级别配置相应的工程师解决问题。

针对一级或升级的二级严重问题,工程师小组将在合同的有效期内通过指定的电话提供如下服务:

非现场技术服务

全天24小时提供服务;

15分钟内做出第一反应,每小时或双方约定的时间提供状态更新

对用户指导并提供协助问题解决的步骤

历史记录查询提供处理方法和步骤

根据情况,提供必要的升级帮助

提供电话问题解答

提供远程拨号电话接入用户系统查询获取信息

如果有需要,进行问题升级

代表用户记录技术严重等级为一或升级的二级服务请求

急救援工程师小组协助:

如果需要,协助提供恰当的替代解决方案

非现场问题诊断和指派工程师

现场问题诊断

在出现一级或升级的二级严重问题的情况下,佛***获取系统信息对故障进行诊断,并评估问题解决的途径和方法。如果原厂工程师远程能够解决,就配置优势资源解决问题排除故障,如果无法远程解决,必须通过现场解决,佛***启动指派原厂工程师的流程。

组建工程师队伍

如果救援服务通过远程方式的努力,不能够解决问题或提供替代解决方案,而工程师的现场服务将能够帮助加速问题的解决,佛***将派出服务工程师到达用户现场,协助问题的解决。

服务交付成果:

紧急救援问题记录报告

问题处置报告

意义:

通过远程紧急救援实现系统的远程监控和管理,故障得到及时排除,弥补空间和时间上的成本,保证系统系统持续运行。

现场紧急救援

服务内容概述:

救援小组到机房以后,及时了解系统情况,并把故障系统隔离起来,把系统故障限制在一定的范围之内,然后,诊断故障点,如果硬件故障,要求用户及时用备件替换硬件,然后排除数据库故障;如果是系统软件故障,佛***排除系统软件故障。如果无法诊断系统故障,服务级别升级,同时启用备用系统或替代系统以便保证系统的持续运行。

具体工作包括:

硬件故障:

测试网络参数

测试主机参数

测试存储参数

确定故障点

等待硬件故障排除,然后进行数据库故障排除,或启用备用系统或搭建新的运行继续系统运行

无法故障诊断,升级服务级别

系统软件故障:

操作系统参数查看

中间件参数查看

第三方软件故障测试

等待系统软件故障排除,然后进行数据库故障排除,或启用备用系统或搭建新的运行继续系统运行

无法故障诊断,升级服务级别

系统恢复:

硬件故障:利用备件替换或构建新计算环境,安装数据库,数据恢复,应用启动,然后数据一致性和应用一致性测试、系统交付;

软件故障:软件升级或打补丁或参数调整,数据恢复,应用恢复,缺失数据修补,数据和应用一致性测试,系统交付。

当系统在指定服务级别内排除故障,本次服务结束。当系统服务级别升级,佛***进一步调配更多的后备资源,甚至厂家资源,直到问题解决为止。

服务交付成果:

现场处理过程报告

责任报告

意义:

通过紧急救援服务,有效利用技术资源,把重大系统故障的损失降到最底。

性能检查及配置检查

服务内容概述:

佛***工程师将定期对应急广播平台系统性能进行检查。检查之后,将提供维护系统稳定性和可用性的建议。

应急广播平台系统性能检查

查找主要的应急广播平台系统性能瓶颈

如果出现性能问题,佛***工程师帮助查找应急广播平台系统的主要性能瓶颈

提供诊断出该性能瓶颈的数据及分析过程

提供相关建议及下一步调整方案

应急广播平台系统的有关性能方面配置的分析

应急广播平台系统的使用情况

提供相关建议及下一步调整方案

性能调整和优化

佛***工程师对系统进行性能检查及配置检查以后,对系统进行性能调整和优化。

服务交付成果:

佛***工程师将提供一份健康检查报告和系统调整报告。在以后的定期服务计划总结中,将对健康检查报告中的内容进行回顾。

意义:

通过性能健康、配置检查和性能调整优化应急广播平台系统,提高系统的整体性能,同时,通过该项服务实现早发现问题和消除缺陷,进而保证系统持续安全运行。

巡检服务

服务内容概述:

佛***安排工程师定期到用户现场,对存储虚拟化引擎、应急广播平台系统和存储管理系统等进行检查,检查的内容包括:系统运行状态、运行效率、是否存在安全隐患、配置是否合理、是否需要优化。

检查系统各项参数;

检查分析系统日志文件,发现并排除应急广播平台系统错误隐患,并给出书面报告;

补丁检查,根据应急广播平台系统运行情况建议是否需要新的补丁,并负责补丁的安装;

检查系统存储空间的增长情况,提供对存储空间增长需求的预估。协助工作人员监控空间异常快速增长。并对每一季度的空间增长提供书面报告;

评估应急广播平台系统运行性能,提供系统性能调整并对可能的潜在问题提出警告;

检查应急广播平台系统安全及用户管理,排除可能的安全隐患;

巡检工作结束后,提交用户《系统巡检报告》,对错误进行分析,提出解决方案及预防措施。

服务交付成果:

给用户提交《系统巡检报告》和《缺陷排除报告》,对错误进行分析,提出解决方案及预防措施。

意义:

通过定期巡检,使系统的潜伏期缺陷和故障得到发现排除,进而保证系统持续稳定运行。

[全文已结束,注意以上仅为全文的文字预览,不包含图片和表格以及排版]

以上为《应急服务方案》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

阅读本文的人,还看了

猜你喜欢

最近更新

关注我们

qrcode

49文章网提供了丰富的唯美、励志、伤感、正能量等经典文章.如果你需要找名人名言、诗词名句、好词好句等,相信在这里能够找到想要的.