在日常IT運維管理中,IT運維人員就是企業IT環境發生故障的救火員,而日志數據就是運維人員的滅火器。在云計算時代,日志具備非凡的偵查和分析意義。隨著信息技術的發展,企業IT環境趨于復雜,眾多產品線,成百上千的服務,每個服務時時刻刻都有海量的日志數據,形成的監控日志已達成千上萬條。然而,海量日志數據也給IT負責人帶來了新的挑戰。
理想化運維故障解決 VS 現實中的告警風暴
常見業務環境中,用戶訪問業務系統時,需要IT環境中的數據庫、應用系統、訪問系統、服務器、反向代理與負載均衡服務器、系統服務器等多方配合,才能讓用戶正常訪問。如果數據庫產生故障發出告警,企業IT運維管理人員就會收到與之相關的訪問系統、應用系統、服務器、系統服務器等多個告警通知。一旦有同一故障根源引發其他相關故障,就會產生海量告警信息。
傳統的IT運維思路是在及時止損后通過逐步排查縮小定位的方式進行故障根源確認。并借助告警指標相關的日志數據進行綜合查看分析。然而,這些告警日志來源散亂、格式各異、且數據量巨大,運用傳統運維方式進行逐一排查,不僅浪費了大量的時間精力,還可能為企業帶來巨大的經濟損失。因此,一款可以快速定位故障根源,又可實現對日志數據統一管理分析工具就顯得格外重要。
AnyRobot敏捷分析的日志云,分分鐘定位故障根源
AnyRobot敏捷分析的日志云,通過對日志數據進行集中采集、存儲,實現日志數據統一管理和可視化分析,滿足企業日志合規留存、快速故障根源定位、實時監控IT環境運行狀態,分鐘級定位故障根源,提升IT管理人員工作效率。那么,AnyRobot如何做到分鐘級定位故障根源的呢?
日志數據整理匯集:實時采集解析,清晰展現告警信息AnyRobot 采用syslog/ jdbc/http等多種采集協議和采集策略,支持整個IT管理環境中的所有日志數據信息的實時采集。同時,通過設置AnyRobot日志解析規則,可將產生告警的日志數據格式轉化為易用性較高的日志信息。故障根源分鐘級定位故障告警:精準智能告警由于日志格式不一,傳統告警設置需針對某一系統運行情況分別設置單一告警規則。而在AnyRobot中,運維人員可針對某一事件設置多重告警規則,實現精準智能告警,并可按照告警的危險等級以郵件或短信形式直接告知運維人員,降低故障發生造成的損失。故障查詢:檢索告警日志類似于“百度一下,你就知道”的日志數據搜索引擎,SPL搜索過程語句可將業務日志、安全設備日志、中間件日志、數據庫日志等數據進行分類整合,可將故障發生的日志信息件進行快速檢索,直接追溯故障信息。故障定位:建立告警信息的關系圖譜通過日志搜索某一故障告警日志,建立關于這一日志信息的關系行為圖譜,查看其是否是故障產生的根源,或是有其他故障引起的關聯故障告警。故障分析:可視化分析故障事件IT運維業務中的關鍵故障考核指標做成可視化圖表或者儀表盤,進行高亮顯示,分析過往發生故障設備及系統的占比,可以做到提前優化故障多發設備及系統的運行狀況,避免同類故障再次發生。
故障預測:提前預知,規避風險AnyRobot機器學習根據以往故障發生的日志數據進行建模,判別IT環境的運行中未來可能發生的故障,提前規避故障風險。
目前,AnyRobot已成功為包括國家審計署、國家衛計委、廣州海關、中國人民公安大學、重慶郵電大學、北京協和醫院、中國中鐵、湖南移動、陽煤集團等在內的眾多知名企業機構提供了日志數據管理分析服務,獲得了企業客戶的一致認可。
文章摘自愛數
歡迎聯系寶通集團咨詢愛數產品信息
寶通集團聯系方式
咨詢熱線:0755-82964380
寶通官網:www.tgdh.net.cn
客戶垂詢郵箱:xinyuan.guo@ex-channel.com
客戶垂詢QQ:1953700525
地址:深圳市福田區深南大道1006號國際創新中心C座11樓
郵編:518026