中文(中国)
系统结构
ITOMsystem是按照SOA架构进行总体设计, ESB进行组件通信,构建技术进行部署的。其软件结构如图1-1所示。其中系统元数据库是业务模型与技术模型的映射关系,它是在安易博多年的专业技术积累和大量客户调研基础上建立起来的。
ITOMsystem的管理域包括网络基础架构、主机、中间件系统、数据库系统、系统应用。同时,ITOMsystem全面开放的信息接口还可以快速地集成第三方的安全管理产品、桌面管理产品、环境管理产品等,从而支持IT运维管理的全过程。
为了保证高效地管理和维护,ITOMsystem由五层逻辑结构组成,从下到上依次为感知层、功能层、洞察层、业务层和展现层。
感知层。主要负责对各类关键IT 资源进行监控,获取其状态和性能信息。采用基于测试的网络监控和基于统计(SNMP)的网络监控相结合技术,可选地在被管理的机器上安装SNMP 协议或者开启SSH 等端口。ITOMsystem IT运维管理系统通过部署广泛的感知器和完备的测试用例,能准确全面地获取业务系统中各设备的相关数据信息。
功能层。根据感知层得到的数据和信息,对网络中的各个技术部件进行管理。本层对应于传统的网络管理功能模块,如配置管理、性能管理、应用管理等功能。ITOMsystem IT运维管理系统通过配置固化等技术,使网管功能更加准确、完备和易操作。
洞察层。是整个管理系统的枢纽,它根据业务层的需求和指定,对感知层产生的事件进行集中分析和统一处理,并利用测试技术主动获取更多有效的信息,然后将分析结果传递给业务层和展现层,利用数据库对历史数据做汇总、修剪入库,生成各类性能、事件统计分析报表,并根据这些信息对异常状态和故障情况产生报警和进行记录。其分析过程结合基于构建技术的元数据信息,以业务为监控的基本单元,精确洞察系统中与指定业务相关的数据信息。
业务层。允许用户根据业务指定特定的功能和性能需求,如针对某个业务的网络访问延迟预警与诊断,再根据系统元数据所定义的业务与技术的关系,将业务需求划分为由若干的技术需求组成的列表。业务层既保证了技术系统更好地符合业务需求,又提高了用户操作效率,降低了管理的复杂度。
展现层。将综合资源性能参数和故障事件集中地显示在一个统一的界面(portal)内。通过前瞻式的监控和本地纠错,以及一旦出现问题后的自动修复,ITOMsystem IT运维管理系统可以最大限度地提高IT 管理人员的工作效率,简化管理所需要的技能,实现客户系统管理的自动化。
基本功能
为了满足企业全面地施行IT运维管理的需求,AnyGlobe/ITOMsystem基于在网络管理领域多年的实践经验,为用户提供良好的运行和维护管理流程,能够有效、有序地帮助IT运维管理人员进行故障管理、配置管理、性能管理、设置管理、监控管理、拓扑管理、值班管理等管理工作。系统的基本功能涵盖了网络运维的各个环节。
1.业务管理功能
值班管理。AnyGlobe/ITOMsystem为运维和业务人员分别提供了值班管理所需的各种功能,包括值班部门管理、值班人员管理、值班表管理、值班安排与下发、值班日志和交接班管理等。
派单管理。主要包括:工单录入、工单分发和通知、工单跟踪、工单归档等功能,用于解决海量告警的自动分发,记录追踪任务的处理进度,评价管理业务人员的工作质量等。
知识库管理。通过将成熟可行的解决方案录入知识库,进行数据共享,方便查询,快速排除故障,从而达到提高用户“自助式服务”能力的目的。AnyGlobe IT运维知识库是企业不可多得的宝贵的财富。当运维人员进行事故、问题、变更和发布管理时,可以根据不同资源类型自动关联该类型的知识条目,帮助运维人员快速解决问题。
报表管理。报表作为信息的载体在IT运维管理过程中起关键性的作用, ITOMsystem提供了IT运维全方位的报表模板管理,支持故障报表、预警报表、统计报表、值班报表等。
2.洞察管理功能
用户建立一个洞察请求,将其关联到特定业务,系统根据业务模型指定一组管理对象,自动监控这些管理对象的状态和性能。用户设定洞察请求时,分为面向业务与面向管理域两种情况。面向业务则指定与特定业务相关的一组管理对象;面向管理域则指定与其管理域相关的一组管理对象,如所有服务器上的数据库服务。
应用原型描述。应用原型是指某个应用业务所需涉及到的IT资源,包括路由器、交换机、服务器、客户机、数据库服务等。ITOMsystem通过快捷的操作可以在系统setup阶段预定义客户企业的各种应用原型。
业务模型描述。业务模型是指某个具体的业务与IT资源的关系,通过在应用原型上进行参数设置,将应用业务所涉及到的资源对应到某个具体管理对象,将业务表达为一组管理对象的描述。
洞察设置。用户在操作界面上建立一个洞察请求,指定洞察名称即可。
洞察显示。系统定时扫描与用户请求的业务模型描述相关的管理对象状态和性能,当状态和性能发生变更时,将变化展示给用户。
洞察告警。当洞察监控的管理对象组有管理对象出现故障或者性能超过规定的阈值时,洞察管理模块以业务告警方式通知用户。
3.网络管理功能
拓扑发现。AnyGlobe/ITOMsystem采用分布式多视角拓扑发现和管理机制,可以快速准确地得到网络拓扑全视图,自动发现网络的连接关系,详细到端口与端口的连接,设备和端口的具体信息等。这些信息不但可以帮助管理人员查看网络的连接和配置信息,而且在发生故障时,可以帮助判断故障点的位置,进行准确的故障诊断。
拓扑管理。AnyGlobe/ITOMsystem先进的拓扑管理体系能直观地展示网络中设备的连接、网络状态、管理对象状态,自动生成全拓扑图、局部拓扑图和物理拓扑图,让用户在管理中心能简单快速地发现全国范围内所有出现问题的管理对象位置。
资源管理。AnyGlobe/ITOMsystem将用户的硬件设备、软件、文档记录和网络链路等都归为资源统一管理。用户通过简单的查询操作,就能知道自己所有资源的动向、资源花费及维护的相关信息等。当用户资源发生改变时,同样能进行增、删、改等操作。
配置管理。AnyGlobe/ITOMsystem首先进行配置固化,然后以周期性动态验证的方法进行高效而简洁的管理。配置管理通过配置管理库识别、控制、维护与检查企业的IT资产,高效地控制IT基础架构与服务,并为其他流程(如故障管理、性能管理、预警管理等)提供准确的信息。
故障管理。对软硬件设备的运行情况、设备安装环境和网络状态等进行管理,负责解决 IT 运维管理中遇到的所有潜在的和已经发生的问题的流程,找到这些问题的根本原因,并提供临时措施与根本解决方案,防止问题再次发生或减少问题的数量。用户可以直接手工新建问题,或者由管理中心与故障管理来触发问题管理流程。
性能管理。通过SNMP、ICMP检查网络设备的性能、线路的连通性和服务质量。性能数据存储在数据库中,通过性能管理的呈现界面形成各种性能报告,并为预警管理提供信息。AnyGlobe/ITOMsystem引入了AnyGlobe独特的基于测试的性能管理技术,可以高效地定位和测量网络性能,实现对网络性能的感知、处理、分析和报告。
应用管理。对网络和服务器上部署的大量应用服务进行监控和管理。能管理服务器里面运行的应用服务,管理内容包括时延、是否可用等,管理对象包括数据库服务、HTTP服务等。
4.用户管理功能
提供用户对部门信息、人员信息(包括登录与权限)、角色权限以及用户个人信息的配置与管理。
用户管理。可对系统用户(部门经理、管理用户、业务用户等)进行增加、删除与修改。
角色管理:系统采用基于角色的访问控制,需要对每个角色的操作和管理权限进行定义与修改。为了方便管理,每个系统用户可以动态地对应多个角色。
人员信息管理。可以快速录入企业员工信息,包括姓名、年龄、联系方式、邮箱等,并提供对人员信息的增加、删除与修改功能。
部门管理。根据企业的实际情况定义各个部门,并将企业员工指定到对应的部门。可以设定多个层次的部门关系。
责任域管理。责任域指该用户负责管理和维护的业务与功能。每个系统用户除了具有一定的权限域,还具有不同的责任域。本模块提供了对用户责任域的指定、修改和删除。
5.系统构建功能
AnyGlobe/ITOMsystem的重要特点是可以根据用户需求来“随心所欲”地构建运维管理系统,而不需要进行二次开发或集成。安装并部署完成ITOMsystem产品组件之后,需要根据特定客户的需求进行应用构建 (Building),其主要过程包括以下四个步骤。
创建 (Create) 功能。根据用户的业务功能需求,创建多个满足用户业务需求的功能。
配置 (Config) 要素。针对每个业务,逐个配置业务的功能要素。
设置 (Setup) 参数。针对每个业务要素,设置其对应的参数。
个性化 (DIY) 要求。针对每个业务,个性化设置其多种操作和管理角色。
6.系统维护管理
系统备份与恢复。系统备份,用户可以在界面上通过点击按钮进行备份数据库的操作;也可以在配置中设定自动备份的时间,这样能避免用户忘记备份而导致出现数据遗失的现象。系统恢复是指用户删除数据或其他原因导致数据丢失时,可以进行还原操作。用户可以通过点击还原按钮选择还原的时间来恢复数据。
数据导入与导出。用户只需提供数据库名称、源sql文件路径、文件名称,即可进行数据的导入,或将系统数据导出供第三方系统使用。
产品特点
AnyGlobe/ITOMsystem具有以下与众不同的技术特点。
1.网络结构的广适性
ITOMsystem可管理的网络组织结构非常广泛,既可以是传统的层次式多中心网络,也可以是采用虚拟网络构建的分布式异构网络。其特有的感知技术克服了传统SNMP管理受防火墙限制,它具有防火墙穿透功能;ITOMsystem的分布式多视角管理布局,也使其管理域可以得到自适应扩展和支持。
2.系统的可移植性
AnyGlobe/ITOMsystem采用J2EE 体系结构开发,代码全部采用Java语言编写;采用先进成熟的MVC 模式,三层架构,显示层、逻辑层和业务逻辑层完全分离,具有极高的可移植性,能在Windows、Linux、Unix 等不同平台下顺利移植。可以根据用户要求提供Windows、Unix 或Linux 版本。全中文界面,完全支持日常用户级的运营和维护。
3.分布式多视角的管理布局
AnyGlobe/ITOMsystem通过部署众多的管理点来实现分布式管理,每个管理点都被指定了特定的管理域(一组管理对象)。AnyGlobe/ITOMsystem要求每个管理对象至少处于两个管理点的管理域中,以便保证每个管理对象同时被两个以上的管理点从不同的视角得以感知,从而保证故障定位的精准。
4.分层次多级的管理组织
AnyGlobe/ITOMsystem的Manager之间采用分区管理,ManagerCenter之间采用分级管理,因此ITOMsystem可以部署成多级中心运维模式。用户可以根据地域、部门、应用等情况,建立地域和设备及资源的复合管理概念,将系统中各项设备和资源按用户权限设置成不同管理域。按照地域和部门分布管理用户权限,使IT 运维人员各司其职、分工明确、提高运维效率。系统同时能提供历史数据及实时数据的按级汇报,上级能及时看到下级网络拓扑的实时变更,下级紧急告警信息在上级网络拓扑图中能实时显示。汇总数据具备真实性,避免了人工分级网络管理时下级网管人员汇报网络运行情况时存在的瞒报、误报和漏报等现象(包括实时数据和历史数据)。
5.故障的精准定位、追踪与及时告警
AnyGlobe/ITOMsystem通过高效的故障搜索引擎,准确定位事故原因;采用图形化链形结构展现,用户可一目了然地确定该次事故的根本原因,对症下药,快速解决事故。同时,系统还提供了配置固化和配置效验功能,可以快速及时地发现并追踪系统软故障(即配置修改故障),进而实现责任追踪。
6.面向业务的性能深度分析
AnyGlobe/ITOMsystem提供了业务洞察管理,用户通过建立一个洞察请求,将其关联到特定业务,系统根据业务模型指定一组管理对象,自动监控这些管理对象的状态和性能,可以进行性能的深度分析。用户可以设定面向业务与面向管理域两种洞察请求,面向业务是指定与特定业务相关的一组管理对象,面向管理域则指定与其管理域相关的一组管理对象。
7.系统健壮性的全面洞察
ITOMsystem的洞察功能模块将感知层感知到的管理对象信息转换为业务层使用的网络信息,它可以对系统健壮性提供全面、深入和准确的洞察。洞察功能的核心是故障筛法和全局延迟算法,通过事件机制进行高效的系统通信。
8.可视化的系统运行实时动态展现
ITOMsystem提供基于Web的灵活呈现,可以将ITOMsystem的管理模块按照用户的管理习惯和需要进行呈现定制,为管理人员提供实时直观的监控界面。既可以提供分类的事件列表,也可以定制综合的逻辑视图,还可以根据管理习惯和需要定义分层、分权的网络实时监控界面。管理人员可以监控网络的总体状态,也可以查看详细的事件信息,并且调用各种辅助工具,如PING、Telnet、Traceroute、手工发送短信/邮件通知、对事件进行确认/升级/转发/关闭、手工创建故障单、查询相关事件等,从而更方便地进行测试和诊断。
9.基于知识库的故障处理专家系统
系统知识库是建立和完善故障处理机制和对网络性能进行分析的知识汇总,它包括产品内置的知识内容及运维人员在日常维护中新增加的维护知识的积累,记载了对不同异常故障情况的不同处理手段和对异常的性能指标所采取的优化措施,为维护人员及时处理异常故障及性能分析提供辅助分析决策。系统具有添加、修改、删除和查询知识库等功能。
10.“3A”式的派工单作业调度系统
系统提供“3A”式的无所不在的派单管理功能,可以方便快捷地支持作业调度,提高运维效率,节约企业管理成本。3A是指:Anywhere——客户在哪里都能访问到ITOMsystem IT运维平台;Anytime——不分任何时间,只要有相对应的权限,都可以访问Portal;Anyhow——支持多种接入方式,包括浏览器、手机等。
11.灵活的系统构建功能满足各种行业的不同需要
ITOMsystem采用基于构建的技术来部署IT管理应用。不同客户只需要通过调研需求,然后根据部署制度将系统部署到客户网络上。这种基于制度的软件部署策略,可以极大地提高软件产品的自适应性,使得ITOMsystem能够在短时间内迅速地部署到多个不同种类的应用上。高度的软件自适应使得实施过程无需专业级开发人员,只需经过简单培训的维护人员即可完成。
创新亮点
AnyGlobe/ITOMsystem IT运维管理系统以用户需求为牵引,以和谐管理为理念,坚持技术创新,融合贯穿了多项新技术和部分国家863重点课题专利技术。
1.基于SOA的软件体系架构
ITOMsystem采用面向服务的体系架构(Service -Oriented Architecture,SOA)整合系统的各个部分,使用户可以不受限制地重复使用软件,把各种资源相互连接起来,只要IT人员选用标准接口包装旧的应用程序,把新的应用程序构建成服务,其他应用系统就可以很方便地使用这些功能服务。ITOMsystem的各个组件和子系统采用ESB(Enterprise Service Bus,即企业服务总线)进行网络通信。ESB是传统中间件技术与XML、Web服务等技术结合的产物,其概念是从面向服务体系架构发展而来的,它是一种可以提供可靠的、有保证的消息技术的最新方法。ESB中间件产品利用的是Web服务标准和与公认的可靠消息MOM协议接口(例如IBM的WebSphere MQ、Tibco的Rendezvous和Sonic Software的SoniCMQ),能支持在分布式应用之间通过中间层(如集成代理)实现直接对等沟通。
2.分布式多视角管理技术
AnyGlobe/ITOMsystem的基本构成有三个要素:管理中心、管理点和管理对象。管理系统可以布置众多的管理点来实现分布式管理,每个管理点都被指定了特定的管理域,管理域是一组管理对象。AnyGlobe/ITOMsystem要求每个管理对象要至少处于两个管理点的管理域中,以便保证每个管理对象可以同时被多个管理点从不同的视角得以感知,从而保证故障定位的精准。
3.无源的网络感知技术
对于“尽力而为”的IP网络,用SNMP来实现网络管理的作用和能力十分有限,通常只是看其功能,要实现强有力的管理则必须有新的技术。AnyGlobe /ITOMsystem提出了一个基于网路探测方法的网络感知技术,实现了对管理对象特征、状态和特性的感知。这种探测只需在管理对象中部署少量的Agent软件,因此我们称此网络感知技术为无源网络感知技术。
4.面向业务的洞察技术
ITOMsystem提供了业务洞察管理,用户通过建立一个洞察请求,将其关联到特定的业务上,系统根据业务模型指定一组管理对象,自动监控这些管理对象的状态和性能,可以进行性能的深度分析。用户设定洞察请求时,可分为面向业务与面向管理域两种情况。
5.基于应用原型的业务建模方法
应用原型是指某个应用业务所需涉及到的IT资源,包括路由器、交换机、服务器、客户机、数据库服务等。业务模型是指某个具体的业务与IT资源的关系。通过在应用原型上进行参数设置,将应用业务所涉及到的资源对应到某个具体的管理对象上,最终将业务表达为一组管理对象的描述,便可得到系统的业务模型。ITOMsystem提供的应用原型描述功能,使用户可以在系统setup阶段,通过快捷的操作预定义各种应用原型。
6.网络性能的数学模型与分析算法
ITOMsystem通过分布式多视角技术获取管理对象的不同视角的性能信息,但是由于网络延迟感知,只能得到管理点到被测管理对象的信息,而不能得到任意两个管理对象之间的延迟信息。因此,ITOMsystem在洞察层通过全局拓扑模型,以部分测出的延迟为输入,通过全局延迟估算算法,可以得到网络中任意两个管理对象之间的延迟性能。
7.自适应软件工程方法
软件具有自适应能力是实现通用性的前提。自适应对象模型(Adaptive Object-Mode,AOM)中的元模型(metamodel)、描述驱动(description-driven)和运行时反射(runtime reflection)等技术是开发具有灵活性、可配置性和自适应性的应用系统的重要方法。ITOMsystem在应用模型设计、数据设计、程序设计等不同阶段都使用了自适应的软件工程方法。
建立自适应对象系统的两个主要思想是描述驱动(Description-driven)和反射(Reflection)。以元数据描述变动的配置信息,并在运行时解释执行元数据建立的对象模型。系统的解释机制利用运行时反射(runtime reflection)技术把元数据映射为对象模型的运行时描述。通过将元数据存于数据库或XML文件中,而不是写在代码中,当业务需求变化时,只需改变对元数据描述,就可在运行时反映需求的改变,而不是像过去一样通过写代码来实现用户需求的变化。自适应对象模型体系结构中,不仅以数据而非代码来表现配置信息,而且还让用户自己定制配置信息,最终用户驱动开发,为用户提供了更强的创建、定制和扩展系统的能力,缩短了开发周期,减小了用户和开发人员间沟通的困难,使领域专家可以专注于使用丰富的领域知识建立业务模型。
8.基于“筛法”的故障智能搜索算法
基于“筛法”的故障智能搜索算法是用户实现故障精准定位和及时告警的故障搜索引擎的算法。它是基于测试的一种故障搜索算法。所谓“筛法”是指对于所有管理对象的集合M,如果一个测试是成功的,则该测试所有涉及的管理对象将被确认为是正常的(即:非故障的),则可以从管理对象集合M中筛去;所剩的管理对象集合M’,则是M的一个子集,再对M’进行测试。如此递归,直至收敛,则可精确地搜寻到故障点。从而得到故障的根本原因,实现了故障搜索的自动化。
运行环境
1.服务器
服务器:PC Intel PIII600以上服务器
内存:1GB以上
磁盘空间:10GB以上
Tomcat 5.0以上 或 IBM Websphere Application Server
2.数据库
Oracle、Versions 8i、 9i、 9i Release
Microsoft SQL Server 2000、2005
Mysql 4、5
DB 2
3.客户端
PIII 以上计算机,128MB内存
IE 5.5或更高版本
4.网络环境
安装并配置TCP/IP 协议;
需要管理的网络对象必须支持SNMP;
同时能够完整的提供rfc_1213 MIB 信息;
如果是交换设备,还应该提供bridge MIB 信息。
5.操作系统
Microsoft Windows 2000(Professional 或Server,Service Pack 3);
Microsoft Windows XP(Professional 或Home);
Microsoft Windows 2003(推荐);
Unix 系列;
Linux系列。
6.其它
Microsoft Internet Explorer 5.5 及以上版本,必须预先安装。