澳门网上正规赌场网址华夏银行厂商云建施,把握IT运转一体化管理的内涵

把握IT运维一体化管理的内涵

把握IT运维一体化管理的内涵

评论 邮件 纠错2014年04月02日11:50 来源:中国城乡金融报

IT运维一体化管理是大家普遍关注的热门话题。伴随着信息科技的迅猛发展,传统分散式、粗粒度、低效率的IT运维管理模式已经难以满足大规模、多层级、全覆盖的运维管理需求,各大金融机构纷纷将目光聚焦于IT运维一体化管理,业界专家也开始深入思索和探讨IT运维一体化管理的内涵。那么,它的内涵具体包含哪些内容?

以科学的管理机制为先导

为实现IT运维一体化管理,首先要从全局角度出发,建立科学高效的IT运维管理机制。目前,业内普遍以“纵横交集、平灾融合”为核心,构建了“两地三中心”,并按照“本地高可用、同城灾备为主、异地灾备为辅”的管理模式,以数据中心为生产中心,与同城灾备中心、异地灾难备份中心实现无缝对接,形成“三位一体”的IT运维管理机制,涵盖生产运行各个层级和节点。通过这个管理机制,横向上,逐步实现从生产到灾备的统一指挥调度,纵向上,完善各级运行中心到网点的一体化管理,有效解决IT运维管理横向分散、纵向分段的问题。

同时,为了准确、客观地评价IT运维一体化管理的效果,针对生产运行事前、事中、事后全过程控制的要求,还需建立一套完整、规范的生产运行质量评价机制。总行层面,通过制定全行生产运行风险容忍度考核指标,以交易量、设备规模和辖内机构数等为维度,设立信息系统可用率和重要信息系统累计中断时间等核心指标的可容忍值,不断优化考核方式。分行层面,比照总行的质量评价标准加强对辖属二级分行生产运行工作的评价考核。通过总分行生产运行、监督检查、考核整改的全面质量管理,进一步提高IT运维一体化管理水平。

以完善的制度流程为基础

为了适应IT运维一体化管理端到端的实际需求,需遵照相关的IT运维管理标准,建立覆盖总行、一级分行、二级分行三个层级的生产运行制度体系,规范生产运行管理的各个环节,保证IT运维一体化管理的质量和效率。在总行层面,通过建立全行性的生产运行管理制度,统一部署和规范生产运行管理工作中原则性和全局性的内容;在分行层面,结合分行实际,制定相应的生产运行实施细则、操作规程和操作手册,不断细化日常生产运行管理工作的各项要求。通过不断补充和完善,将日常生产运行管理工作的各项要求不断细化,形成统一的运维管理制度体系,为合规运行提供保障。

此外,IT运维一体化管理将实现由职能管理向流程管理转变。在吸收和借鉴ITIL最佳实践、ISO20000IT服务管理体系的基础上,应结合IT运维一体化管理的内容、环节和要求,从事件管理、问题管理、变更管理、配置管理、容量管理、发布管理、值班管理、服务连续性、系统可用性、服务请求等多个方面,优化IT运维管理流程,加强管理流程整合,建立IT运维、监督、评审和持续改进的流程化管理模式,使各项运维操作有流程、留痕迹、可审计,提升IT运维一体化管理的效率和科技服务水平。

以复合型人才为保障

随着IT运维一体化管理的深入推进,实现IT运维管理自动化、智能化已迫在眉睫。当前,运维管理自动化建设主要围绕运行维护和技术服务两方面,从统一调度与服务、操作与监控、分析与展示三个层面,建立统一、集成、开放并可拓展的运维管理平台,包含生产调度平台、集中监控管理平台、服务支持平台、运行质量分析平台等,着力提高IT运维自动化管理水平。通过构建涵盖生产运行“监、管、控”各个环节的全面的技术支撑框架,逐步实现总分联动的生产指挥调度、运行实时监控、运维技术支持、运行质量分析等功能,由被动式管理向主动式服务转变,进而实现IT运维一体化管理质量和效率双提高。

当然,高效的IT运维一体化管理离不开高素质的运维服务队伍。既精通技术又善于管理的IT运维管理复合型人才已经成为科技队伍建设的新目标。要统筹规划IT运维人员队伍的体系架构、人才规模、层级设置、岗位职责等内容,建立有价值导向的绩效管理体系,创新IT运维人才晋升机制,完善IT运维队伍的激励和约束机制,强化运维人才培养机制,提升运维人员一体化的组织管理、应急响应、沟通协调等联动能力,着力锻造一支专业化、标准化、准军事化的生产运行队伍,为安全生产保驾护航。

IT运维一体化管理是随着科技快速发展和信息技术深入应用而产生的新课题,如何实现科学有序、集约高效的IT运维一体化管理,这方面的研究和探索才刚刚起步,还需要我们通过实践不断优化完善,持续改进。

把握IT运维一体化管理的内涵 评论 邮件 纠错2014年04月02日11:50
来源:中国城乡金融报 IT运维一体化管理是大家…

兴业银行成立于1988年,在30年的发展过程中,从区域性银行到全国性银行,进而向综合化、集团化、国际化迈进,其IT基础架构也经历了单中心、主备中心、两地三中心、多活中心,到目前共享中心的演进,并在此过程中,逐步形成多层次、多地的云化资源布局。IT基础架构的日益复杂,业务对IT服务要求的不断提高,都对运维工作带来挑战。如何借助现代化、自动化乃至AI的力量,更好地支持新型云服务,确保关键业务和数据应用的连续性?2019年3月8日,兴业银行数据中心副处长任继尧在金科创新社主办的“2019金融科技创新实战沙龙”活动中,分享了兴业银行企业云建设实践经验。

澳门网上正规赌场网址 1

A银行以”服务至上、科技先行”的原则,大力推动科技部门和信息系统的建设,并注重强化运维体系建设,提升系统服务水平,保证关键应用的可用性。

云运营管理实践

   
在A银行科技部门强化运维体系建设的过程分中,A银行运维中心总经理提出了A银行IT运维服务管理的三点和四化指导原则,积极的推动A银行IT服务管理从被动的基础的IT运维工作到主动的高阶段的IT服务管理。

任继尧首先介绍了兴业银行云资源的布局,兴业银行五个数据中心分布在四个城市:上海、福州、成都、北京。其中上海、福州、成都三中心实现三地多活,上海和福州部署同城灾备中心。在组织架构上,遍布三地的13个职能处室以及由架构师团队、系统专家团队、网络团家的团队、机房场地专家团队、协同办公专家团队组成的虚拟技术专家组共同支持四城市五机房的IT基础设施运维。

  
 **做好运维的三个关键点就是监管文件明确给以指引的:   运维流程管理、监控及一体化管理、应急管理**

目前兴业集团已形成多层次、多地、多机房的云环境:生产数据中心云、异地灾备云、开发测试云、银银业务云、卡中心云、集团业务云等。多云模式部署原则是:物理层面,各业务分区独立建立标准化私有云,遵循统一的部署和管理规范,便于未来云资源调配和整合。平台层面,先分别建立AIX资源池和x86资源池,未来逐步向x86平台过渡。云部署物理位置,可以根据需要选择适合的机房,不局限于现有机房场地。至于多云管理,任继尧表示,目前云管理还是独立的,并未实现对多个云的统一管理。未来希望云云之间实现弹性资源分配,解决目前数据中心运维痛点。

    加强运维流程管理。进一步完善运维管理流程,健全运维管理制度和标准,重点加强事件管理、问题管理、变更管理、配置管理等关键管理流程和数据管理、机房管理等制度标准建设与执行力。加强管理流程整合,完善信息交互机制,形成闭环管理。强化事件分级制度,建立有效的事件升级及响应机制;加强事件后续分析与处理,不断优化管理流程;建立变更分类标准和变更分级审批流程,完善变更窗口管理制度,有效降低变更对生产运行的负面影响;制定配置参数移植、修改、备份、存储、更新、销毁等方面的管理制度,控制配置操作引发的风险。完善数据存储、使用、传输以及备份管理,进一步制定标准、规范,重点强化客户信息和经营分析数据等敏感数据访问控制、清理、销毁以及数据变形使用管理;进一步加强机房人员、供电、空调、防火管理。

任继尧重点介绍了兴业银行生产云的管理运营经验:“我们通过生产云平台对多个机房的IT基础设施进行统一管理。同时通过关联系统:统一认证、CMDB、ITIL、自动化运维、运维操作管理系统进行深度连接,对外提供IaaS、PaaS服务。”

加大集中监控及一体化管理力度。健全生产系统软硬件、网络及应用系统性能监测指标体系,优化监控策略;在实现对系统、设备、网络、基础环境等监控基础上,重点加强对核心应用系统和电子银行渠道监控;构建统一监控平台,统一管理和展现各种监控资源,实现集中告警方式,全面、及时掌握系统整体运行状态,快速定位故障、缩短处理时间;加大对总分行监控系统整合力度,提高总行对分行生产系统监管能力,进一步完善监控、响应、处理、报告、反馈和跟踪机制,实现全行范围基础设施和主要应用系统生产运行情况的全面监控,提高运行管理的全面控制能力。提高运维管理自动化水平,整合操作、维护、监控、响应、处理等管理流程,推进企业级总控中心(ECC)建设,促进运维管理一体化。

服务对象主要面向业务部门以及集团内21家分行、3家子公司和1个信用卡中心。在运作方式上,进行了服务定价和利润化运作探索,遵循“保证服务质量、信息安全、鼓励技术创新,谁使用谁付费”原则,按照SLA(
Service-Level
Agreement,服务等级协议)向IT资源使用者收取费用。2017年1月首次发布《数据中心IT服务目录及服务价格》,包含7大类109项服务。

加强应急处置,提高协作能力。应急管理包括故障应急处理、高可用冗余建设、灾难恢复计划DRP或业务连续性计划BCP等几方面。

在任继尧看来,此种运作模式的优势体现在三个方面。一是风险隔离:在不同子公司使用IT服务时建立防火墙机制,进行有效的风险隔离,满足监管要求。二是市场化:IT服务价格选择服务于金融机构且具有较高安全与服务等级能力的供应商同类服务项目公开市场标价作为参考。三是降低成本:通过资源复用、价格引导等方式,实现全集团IT营运成本同时降低。

建立健全应对重大事件(突发事件)的预警、报告、决策、指挥、响应及退出等环节的应急处置机制。制定监测指标,实时监测业务运行状态,及时发现异常情况,及时预警;建立清晰的报告流程,明确报告路线;建立应急指挥、决策体系,统筹协调,高效决策,保证指挥流程畅通;制定应急处置响应流程,加强关键岗位人员配置。

尽管很多金融企业都提出过将IT由成本中心变为利润中心,但真正实现的并不多,一些企业只是每年对业务部门象征性收取一些费用,而兴业银行数据中心真正做到了对IT资源的明码标价,按使用付费。
“图2显示了兴业银行IT成本、业务部门支付费用以及传统模式下资源使用费用,P2为数据中心赚取的费用,P1为行内子公司与业务部门节约的IT成本,P1和P2的和为集团所节约的IT成本”
任继尧说。由此可见,新模式下,行内客户和集团实现了双赢:对客户来说,无需建设同城机房;无需维护生产机房;无需采购、维护计算和存储资源。对集团来说,实现集团内架构标准统一;集团内技术标准统一;集团科技一体化运维管理。

建立应急预案一体化管理体系,建立涵盖总体预案、专项预案等预案框架;统筹预案管理,加强预案之间的衔接与配套;建立有效的预案维护机制,涵盖预案制定、评审、发布、变更和回收过程;制定预案编制规范,保证预案编制质量;强化预案后评价与持续改进机制,保证预案有效性。

澳门网上正规赌场网址 2

根据风险战略与业务连续性目标,制定灾难备份体系建设策略与实施路线;以业务有效恢复为目标,逐步加强灾备体系建设;逐步加大数据、系统、基础设施等各类资源的保护范围以及恢复能力;逐步推进分支机构灾难备份建设,提高电子银行渠道灾难恢复能力,推进外联交易、支付、清算等重要渠道灾难备份建设。

图1生产云平台

探索灾难备份体系建设模式,加强架构设计,应用技术创新,加强数据中心集约化、标准化、流程化管理;深入研究数据中心“双活”、“多活”建设模式,提高数据中心之间相互备份、切换和接管能力。

澳门网上正规赌场网址 3

同时银行和E8合作把运维绩效考核KPI及SLA又融合进ITIL运维流程管理系统,达到以KPI引导,转化被动的基础的IT运维工作到主动的高阶段的IT服务管理。

图2 利润化运作资源使用示意

有了上面的三个关键点,做好运维的工作还需要“实现四化”:“合规化、透明化、标准化、系统化”。实现这个四化后,才会有更好的方法和更好的基础去做好运维工作

标准化、自动化建设实践

1、  合规化从监管以及管理高层与风险管理迫切压力需求的角度来说特别重要;内容是“做好信息安全及应急管理”,需要管理流程与安全及应急管理控制手段结合,如ITIL变更审批流程与堡垒机权限控制系统的结合。如ITIL事件升级到重大事件,再升级到灾难等升级流程及应急流程管理,包括灾备恢复演练的流程。基于以上事例郭总认为“应急管理的一部分也是可以利用一些流程化管理实现的”

当前银行针对复杂的IT架构运维现状,普遍从人员、流程、工具三方面进行探索和实现。首先实现标准化运维,其次结合主流的运维自动化技术,实现自动化运维。任继尧在介绍兴业银行标准化、自动化实践时指出,IT运维标准化主要包括异构资源标准化和IT组件标准化。异构资源标准化指,将计算资源池:PowerVM资源池、Vmware资源池;存储资源池:接入PowerVC、vCenter;灾备资源池:统一分配灾备资源;备份资源池:统一分配备份资源、调度备份任务;恢复验证资源池:按需分发标准化验证服务器等异构资源统一纳入生产云平台进行统一调度、管理。IT组件标准化指,生产云平台预先创建所有IT组件,总行、分行、子公司施行统一的标准。“其中我们把应用层、中间层、数据层三层架构也做成了组件,
还包括高可用架构、灾备架构、计算资源、操作系统、数据库等都实现了标准化。”

2、系统化就是利用E8.IT运维管理平台,这种IT服务管理系统将各种IT管理流程、运维管理经验、IT服务管理思想系统化,并能不断优化,扩展。

兴业银行数据中心通过四大自动化平台实现IT运维自动化管理。“最下层是集中硬件管理平台,对服务器、存储、网络等硬件设备统一管理,将设备信息提供给生产云平台;生产云平台负责容量管理,为运维自动化平台提供虚拟机;运维自动化平台进行虚拟机维护;业务连续性管理平台主要负责双活、灾备、主备机切换方面的工作。”
任继尧说,“我们希望通过ITIL、CMDB和调度引擎的结合,架构驱动,实现资源的标准式、一键式交付。”

3、 “透明化”就是运维的管理要对内对下透明,对上对外透明,则实现方法是”健全运维绩效考核评价机制以及SLA,服务级别协议与服务报告管理”这几点。

澳门网上正规赌场网址 4

“透明化”这一点其中有一点奥妙。银行郭总指出,指标只是其中表象的一部分,关键是如何融合进工作流程中,让每个人都知道KPI,并实时了解掌握自己的当前绩效,真正发挥出的KPI导向作用:好用、易用、有用。做好从时效、质量、满意度等考虑的事件、问题、变更管理的基础工作,包括以SLA、系统可用率考核的重大事件或故障、系统容量、性能管理等工作,做好基础、接口与系统化,才能将
“透明化”有了实现的基础,能使得运维部门有压力和动力从IT运维
转向做IT服务管理,变被动运维向主动服务转变,然后从对内、对下的透明化,转向SLA做到对外、对上的透明化。

图3 四大自动化运维平台

4
、”标准化”A银行以银监会的监管要求为基准并结合IT服务管理的最佳实践ITIL制定本行的IT服务管理标准。

具体如何实现呢?用户在ITIL平台上提交资源申请工单-ITIL从CMDB中获取标准化部署架构定义-工单信息流转至云管理平台-云管理平台从CMDB中获取标准化部署架构定义-调度引擎按照以下原则(异构资源按标准自动发放、操作系统模板自动下发、操作系统参数自动配置、数据库实例自动创建、高可用架构自动配置)进行资源编排-资源交付给用户-CMDB同步部署架构定义。“对用户来说,交付的不是一台虚机,而是一整套架构。同时此架构固化在CMDB中,后续可以快速调用。”

A银行信息科技部运维中心根据IT服务管理的三点和四化指导原则,积极推进IT运维服务管理平台的建设并于2012月3月份上线了深圳非凡公司的E8.ITSM系统,把IT服务管理的理念和最佳实践融合进IT运维服务管理平台,真正的推动A银行的IT运维管理转变为IT服务管理。

兴业银行IT基础架构经过物理机阶段、资源池阶段、自动化阶段、云平台阶段发展,高可用部署、数据库安装配置、操作系统安装配置、计算资源分配等效率在每一个阶段都取得跨越式提升。

E8.ITSM是一款比较成熟的本土IT服务管理平台,产品开发公司为深圳市非凡信息技术有限公司,它包括图形化的、具有中国特色的流程管理平台和IT运维管理平台两部分。其中IT运维管理平台包括了运维流程管理、监控及一体化管理平台、应急管理等功能。

业务连续性建设实践

产品方面:非凡公司秉承着做最适合中国企业应用的ITSM产品的理念,围绕ITIL规范,结合国内企业管理文化,构建以“客户为中心,流程为导向,生命周期管理”的IT运营模式。E8.ITSM据有ITIL核心最佳实践管理工具和工作流程,简洁易用;大集中的IT(应用、系统、硬件、网络)配置库和知识库;
超越ITIL的It综合管理流程;简单高效的E8.Net工作流二次开发平台。

与国内大多数商业银行一样,兴业银行采用两地三中心方式实现业务连续性。灾备架构包括数据级容灾、应用级容灾、数据库双活、应用双活几个层面。在数据级容灾层面采用传统磁盘SRDF和虚拟带库。虚拟带库做本地、同城以及异地复制。目前兴业银行120多套业务系统做到数据级灾备,30多套系统达到应用级灾备式。多层级容灾系统通过业务连续性管理平台统一管理,实现一键切换。

经验方面:非凡公司具有多家大中型企业和银行的实施经验;本着对客户负责的原则,非凡公司实施方法采用顾问加产品的方法帮助企业建立IT运维管理体系、规范各岗位职责和流程,把IT运维管理的最佳实践和企业的实际相结合提升企业的IT服务管理水平。

澳门网上正规赌场网址 5

图4 业务连续性管理平台

内容由李庆莉整理编辑。

Post Author: admin

发表评论

电子邮件地址不会被公开。 必填项已用*标注