业务挑战

安全事件分析,通过对多品牌、多类型的安全设备进行整合,找到安全事件之间的关联关系及影响程度。

● 故障分析: 故障定位凭借运维人员的经验进行机械化工作,故障定位速度慢,希望提高到分钟级别。

● 容量规划: 可以对设备的使用情况进行监控,但是无法进行负载分析,需要为设备的使用情况提供量化指标。

● 趋势分析: 对服务器硬件CPU、流量等实时监测,为硬件升级或带宽升级提供数据依据。

ALEIYE解决方案

将该行过去分散在各个系统中的信息集中,其中包括资产信息、设备运行状态、日志、安全事件等全部通过syslog和snmp的方式存储到Aleiye数据平台。在平台中,通过字段扩展、统计、预测、关联资产、日志规则分析等手段完成集运维与安全的高效办公平台。

● 资产信息

资产信息源自于该行内部的IT设备管理系统。通过数据采集的方式同步到数据平台中,并在平台中可进行任意的扩展。是所有业务分析的基础数据。

● 日志

包括网络日志、安全日志、系统日志及应用日志,涉及到多个类型和多个品牌的百余种日志,完美的统一存储在Aleiye数据平台。

● 深度分析

将采集到的多种数据进行交叉关联,日志与日志,日志与设备、日志与业务同时进行关联,准确定位故障、发现安全事件、描述发展趋势。

网络运维管理

在银行体系里,各系统及各服务器网络情况是日常管理的重中之重,Aleiye大数据分析平台可以帮助用户从以下几个方面完成管理,包括:

● 网络事件管理

网络因传播性,同一事件往往会产生大量日志。大量日志不但不会为事件的定位和分析带来好处,反倒会成为影响事件分析的障碍。Aleiye通过微时间窗口内的日志间的关联关系,将日志压缩为事件,事件是用户分析和管理的原子。

● 接口级网络拓扑

提供网络设备间接口级别的连接拓扑,接口连接信息可直接进入资产信息,并提供交互式管理接口。为网络事件 提供更细粒度的分析维度。

● 容量规划

通过对设备监控的同时,将历史的数据通过负载分析算法综合评价设备的使用情况。为设备升级、带宽升级及资源合理化利用提供量化指标。

● 故障定位

根据事件的产生时间、位置及关联资产信息,再通过实时的流数据分析,主动发现事件间存在的共性进行快速定位,并且就故障对服务的影响进行分析。

● 告警

告别传统的一日志一告警的方式,将关键事件(RET)直接变成以报告为主要内容的综合告警。

安全事件分析管理

● 统一管理

Aleiye平台对多类型、多品牌的安全设备数据提供统一的采集、存储、分析平台。兼容主流品牌的安全设备分析功能。

● 标准化

采集安全设备原始日志之后,需要预处理,通过标准化、过滤、归并、信息补全,使原始日志格式统一、分类明确,为实时告警提供依据。

● 关联分析

通过安全事件关联分析完成以安全事件为触发,结合安全资产信息、漏洞情况、安全防护状况等信息进一步挖掘有用信息,直到产生具有较高可信度、明确的问题描述以及具体的处理方式的报告。

客户收益

以成熟的Aleiye大数据分析平台为管理工具,利用专业化的网络、系统、应用存储方案,将该行现有的业务进行整合、标准化,全面的进行关联分析,异常实时告警、业务趋势分析。并且把网络、系统、应用三者的运维工作进行集成,以仪表盘的形式集中展现,完成统一管理。

ALEIYE —— 让大数据更简单!