当传统工业遇上现代技术,如何平衡两者之间的关系,使之和谐共进,焕发更强生机?
项目背景:包头钢铁(集团)有限责任公司(以下简称:包钢)是我国成立后最早建设的钢铁工业基地之一,1954年开始建设,1959年投产。包钢拥有“包钢股份”和“包钢稀土”两个上市公司,是中国主要的钢轨及无缝钢管生产基地之一、华北地区最大的板材生产基地、是世界稀土工业的发端和最大的稀土科研、生产基地。
包钢始终致力于多元发展,并致力于建设“大包钢”,成为世界最大的稀土钢生产基地和最具竞争力的稀土生产、科研基地,年销售收入达到1000亿元以上。
随着包头钢铁(集团)有限责任公司信息化建设的深入, 信息化运维监控管理在企业发展过程中担负起越来越重要的角色,企业利润来源也越来越依赖于信息化的建设水平,而企业信息化的建设水平取决于两个方面:
- 一方面是基础设施的搭建,这是硬件基础
- 另一方面是管理层面,就是如何将已有的硬件基础设施的效能更好的发挥出来,这就和运维管理水平的高低息息相关。
如何及时了解系统的运行状况,有效地降低系统运行的风险,主动的发现并及时解决系统运行故障,让业务系统保持7×24小时的健康、持续、稳定、高效运行,这些都给包钢的信息化运维管理水平提出了更高的要求,也是当前传统工业企业运维管理普遍面临的巨大挑战。
运维挑战
包钢集团 目前拥有网络设备、服务器、存储以及其他IT资源,在整个IT资源管理方面仍处于人工管理阶段,管理运维属于被动管理。
管理设备类型和数量
- 交换机主要为cisco和H3C交换机,共计需要管理80台。
- 操作系统主要有IBM AIX、CentOS、Windows等,共计需要管理35台。
- 数据库主要为IBM DB2、Oracle等,共计需要管理 25套。
- 中间件主要为websphere,需要管理10套。
- 应用主要为HTTP,需要管理10套。
- 存储设备主要为IBM、EMC,需要管理5台。
运维管理需求:网络管理
· 支持cisco、H3C等厂商的各型号设备,支持多厂商设备组成的混合网络自动发现,并且提供设备的真实面板,提供端口关闭与启用操作,可以更改VLAN ID
· 拓扑图的生成支持网络设备的SNMP V1、V2、V3这三个版本的混和生成,并能对SNMP V3设备进行管理
· 支持对全网的网络设备线路按照流量、带宽占用比、丢包率、错包率、广播包等指标的实时负载进行排名
· 支持网络设备的ARP表、MAC表、路由表等表格数据定期存储,差异自动比对,提供路由表历史快照对比。
· 提供任意IP类型对象的监控,支持ping状态、TCP端口状态、URL跳转方式实现该对象的基础管理;
· 拓扑图上的设备和线路支持按照性能参数的不同区间以红、黄、绿颜色进行显示,性能负载可自定义;
· 在拓扑图上可直接显示线路峰值流量、广播流量、组播流量信息;
· 提供网络设备可用率、线路连通率、网络设备负载分析报表、线路负载分析报表、网络告警统计报表等多套基于采集和管理数据生成的客观统计报表。
操作系统管理
· 支持对于Windows、IBM Aix、CentOS等类型操作系统的管理,支持对于CPU、内存、进程、日志、网络流量、磁盘性能的监控;支持对于CPU、内存、进程、日志、网络流量、磁盘性能的监控;
· 支持对主机进程列表的监控,支持定期备份进程表,支持进程表比对,进程状态告警。
· 支持主机趋势管理视图,包括CPU、内存、文件系统,流量指标的对比,磁盘容量可用时间的预测;
· 支持波浪图方式显示所有主机的全局信息,以图形化方式显示主机的常用管理参数;
· 支持系统拓扑图,一张图可以展现所有主机承载的数据库、中间件和标准应用之间的实时状态监控,为主机监控提供全景视图;
· 提供主机可用率、主机性能报表、系统告警统计报表等多套基于采集和管理数据生成的客观统计报表。
数据库管理
· 支持对Oracle、DB2等数据库的各项运行参数进行监控;支持对于各个数据库实时运行状态的实时统计,包含数据库会话数、死锁数实时排行,支持对表空间大小和会话数、缓存信息、锁信息进行重点监管;
· 支持在数据库发生异常时,进行所在主机、数据库关键指标的数据快照,便于事后便捷分析。
中间件管理
· 中间件管理支持对WebSphere 等中间件实时监控;支持图形化方式显示应用的承载主机状态和应用的基本性能信息,同时展示相关的运维负责人和联系方式。
标准应用管理
· 支持HTTP、HTTPS等应用的监控;支持图形化方式显示应用的承载主机状态和应用的基本性能信息,展示相关的运维负责人和联系方式。
存储管理