可视化——IT运维的关键(2)

　　为此，姜岩和他的团队尝试过多种方法，比如使用Agent模式、日志分析、代码植入等方式，不过效果并不尽如人意。由于这些方式直接与被管理系统、应用程序产生交互，也就是说其在监视数据产生的同时，本身也会消耗系统、应用程序资源，而这往往会导致资源紧张，进而导致业务处理性能下降，甚至有不少用户因此而遭受了严重的业务中断故障。

　　在经过多方考量后，最终他们采用了基于网络数据资源的应用性能管理方法，使用CrossFlow BPC（Business Performance Center）网络与应用性能管理产品进行应用梳理，并进行相关的监控管理。

　　而之所以采用这样的方式，也是因为在当前的应用架构下，应用服务层级划分已十分清晰，各层级间的交易全部通过网络传输来完成，基础设施和交付设施本身都以服务为中心向应用提供界限明确的服务功能，使得数据采集设备可以轻松获取关键交易环节的网络数据，这给网络数据源的获取带来了极大的便利和灵活性。

　　据姜岩介绍，整个项目的实施主要有五个关键步骤，包括应用整体监控的标准化制定；监控统一管理的必要性分析；明确监控统一管理的主要目标；掌握监控统一管理的关键技术及监控统一管理最终如何展现与运用。“整个项目的关键词就是整体、统一。”姜岩解释说，只有做到整体监控、统一管理，才能使IT系统可视化，运维工作才能得心应手。

　　整体监控统一管理

　　在具体的实施过程中，姜岩首先对现有应用系统的整体构成做了全面了解、仔细排查，包括哪些应用是跨节点、跨层面的，哪些应用是多维度的；然后按照应用构成信息的不同（不同应用的基础层面构成信息、应用内部构成信息、应用外部关联信息等都不尽相同），设定不同的KPI监控指标，再根据相应的指标分发相应的监控策略。姜岩表示，这样做的好处就是可以全方位多维度地梳理应用监测点，并以体系化的监控指标作为分发策略的参考。在此基础上，构建起了三层架构的监控统一管理平台，其中包含监控对象及代理层、监控工具层及监控管理平台，进而对应用产生的数据进行采集、处理、监控及管理。

　　其中作为数据采集的关键，中间层的监控工具层起着至关重要的作用。因此，据姜岩介绍，他们前后部署了多个监控工具用以监视各个部件的情况，有针对惠普小型机监控的OVO、针对网络事件监控的SORLAWINDS、针对IBM小型机监控的TIOVLI、针对数据库监控的OMS、针对应用性能整体监控的CrossFlow BPC及针对存储环境监控的SOC等。

　　其中针对小型机、存储、网络的监控工具主要监控的是单一类型的系统，而针对应用性能监控的CrossFlow BPC则能在一定程度上起到全局监控的作用。因为当系统中的某一应用出现故障时，CrossFlow BPC能够及时发现，并追根溯源，进行自动故障定位，在呈现应用故障对用户体验影响的同时，指出导致问题发生的根源组件和原因。

　　CrossFlow BPC能够通过交易笔数、成功率、响应时间、响应率及返回码5个指标及交易时间、交易笔数2个维度对关键业务指标进行统计，并进行深入的分析。而其内置的SPV Discovery还能自动呈现被监控网络数据的IP连接性，快速梳理应用组件之间的逻辑访问关系。

　　核心期刊网（www.hexinqk.com）秉承“诚以为基，信以为本”的宗旨，为广大学者老师提供投稿辅导、写作指导、核心期刊推荐等服务。
　　核心期刊网专业期刊发表机构，为学术研究工作者解决北大核心、CSSCI核心、统计源核心、EI核心等投稿辅导咨询与写作指导的问题。

　　投稿辅导咨询电话：18915033935
　　投稿辅导客服QQ：论文投稿

1002080872、论文投稿

1003158336
　　投稿辅导投稿邮箱：1003158336@qq.com