大數(shù)據(jù)平臺運行監(jiān)控系統(tǒng)的研究與應用.pdf_第1頁
已閱讀1頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來,大數(shù)據(jù)技術(shù)迅猛發(fā)展,越來越多的互聯(lián)網(wǎng)企業(yè)開始將項目部署在集群上。在實際應用中,集群資源豐富、環(huán)境復雜,保證集群的正常運行尤為重要,于是大數(shù)據(jù)平臺運行監(jiān)控系統(tǒng)應運而生。監(jiān)控系統(tǒng)旨在實時監(jiān)控集群、節(jié)點以及節(jié)點上計算作業(yè)的運行情況,及時發(fā)現(xiàn)異常并告警,保證調(diào)度任務的順利完成。
  本文對集群監(jiān)控關(guān)鍵技術(shù)進行了深入的研究與分析,針對實時監(jiān)控集群健康狀況的迫切需求,為解決現(xiàn)有系統(tǒng)在作業(yè)運行監(jiān)控方面的局限及不足,重點研究了針對集群作業(yè)

2、運行的監(jiān)控方法,提出了基于snmp協(xié)議的監(jiān)控代理和監(jiān)控插件的實現(xiàn)方案,并搭建了大數(shù)據(jù)集群實驗環(huán)境,通過實驗驗證了方案的有效性,結(jié)果表明本文的監(jiān)控策略是有效可行的,可以保證大數(shù)據(jù)平臺的穩(wěn)定運行,滿足集群監(jiān)控實際需求。本文的主要工作及研究成果如下:
  (1)通過研究大數(shù)據(jù)平臺運行狀況,提出了集群健康指標體系,確定了針對集群、節(jié)點性能、作業(yè)運行三個層次的監(jiān)控指標。
  (2)針對大數(shù)據(jù)集群硬件資源豐富的特點,提出了對集群性能指標

3、的監(jiān)控方案。該方案以Icinga監(jiān)控平臺為模型,通過監(jiān)控插件和NRPE監(jiān)控代理最終實現(xiàn)了對集群資源和節(jié)點性能的監(jiān)控,并且能夠通過郵件、短信等多種渠道實現(xiàn)故障告警,達到及時發(fā)現(xiàn)異常并處理的目的。
  (3)根據(jù)大數(shù)據(jù)集群分布式架構(gòu)的特點,提出了針對作業(yè)運行的監(jiān)控方案。該方案采用日志監(jiān)控技術(shù)進行數(shù)據(jù)采集,通過snmp協(xié)議進行數(shù)據(jù)傳輸,結(jié)合Icinga擴展機制實現(xiàn)了與ROSS監(jiān)控平臺的集成,最終完成了對大數(shù)據(jù)平臺中作業(yè)運行情況的全面監(jiān)控

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論