數(shù)據(jù)庫性能監(jiān)控

 

典型的應用場景

* Surveillance 可以幫助運維人員輕松完成對跨地域的多個服務器,以及多種數(shù)據(jù)庫平臺,進行統(tǒng)一的主動式監(jiān)控。

* 如果某臺 機器異常,管理員將得到警報信號(短信,彈出窗口,電郵,HP Openview、IBM Tivoli等方式),甚至,

   如果過一段時間無人響應, Surveillance可以調(diào)用一些預先編譯好的外部腳本或程序來自動處理一些可預見的異常,

   保證在客戶發(fā)現(xiàn)問題之前就可以發(fā)現(xiàn)問題并解決問 題。

* Surveillance 提供了一整套的圖形化顯示界面,幫助用戶自上而下地了解系統(tǒng)狀態(tài)。警告提示還能引導運維人員逐

   步打開相應的圖形窗口 ,深入到問題的根源去發(fā)現(xiàn)問題解決問題,而不用運維人員去記憶眾多的腳本,有助于新人快

   速上手工作。

* Surveillance 利用記錄的歷史數(shù)據(jù)還原故障發(fā)生時的現(xiàn)場,從而運維人員可以回溯定位歷史故障原因,徹底解決隱

   患。此外,歷史數(shù)據(jù)還 能基于宏觀的角度,以豐富的報表形式,真實地展現(xiàn)系統(tǒng)的運行情況,以供趨勢分析和運維

   決策。

 

事件管理

* 提供關鍵 度量參數(shù)的無人值守監(jiān)控

* 依靠分析 引擎,設定的規(guī)則被不斷的分析,以確定參數(shù)沒有超過閾值設定

* 依靠警告 引擎,可以在事件發(fā)生時,以及事件已經(jīng)被解決時發(fā)出提示或警報

* 改變以往 運維部門通常事后處理的工作流程

事件管理-規(guī)則分析引擎

* 基于規(guī)則 機制,預定義了一整套規(guī)則,且每條規(guī)則都可定義更為靈活的參數(shù)以控制事件的產(chǎn)生

* 用戶可自 定義新的規(guī)則

* 引擎獨立運 行

案例場景分析

案例場景一

* Cache Miss %該指標實時值竟然達到20%,平均值更高達26%,一般這個值不大于5%為佳,超過則說明數(shù)據(jù)在內(nèi) 存中重

   復使用率下降,導致要頻繁進 行磁盤交互到文件系統(tǒng)查找數(shù)據(jù)。。

* 一個cache miss在shared pool(共享池)中發(fā)生比在data buffer中發(fā)生導致的成本更高,由于dictionary數(shù)據(jù)一般比

   librarycache(庫緩存)中的 數(shù)據(jù)在內(nèi)存中保存的時間長,所以關鍵是library cache的優(yōu)化。

* Recursive calls(數(shù)據(jù)字典的訪問回調(diào))太多,不應超過seesion數(shù)的4倍。

案例場景二

*  在 Wait Statistics的窗口里,Segment header與Data Block的wait指標值比較值得關注。

*  Data Block總的wait比率達到100%,非常嚴重;如果數(shù)據(jù)塊一直處于等待的狀態(tài),則導致整個數(shù)據(jù)庫的訪問效率。

   調(diào)大init.ora 參數(shù) FREE_LIST_PROC 解決data block問題。

案例場景三

* 這些是Oracle Library Cache里的一些指標,Get Miss Percent是查找對象的命中率,Pin Miss Percent是讀取

   或執(zhí)行對象的命中率,Reload 是SQL重新解析的次數(shù)。

* 測 結(jié)果表明,SQL AREA中這些指標的值都比較高,導致查詢性能下降,解決方法可以通過一方面檢查應用

   代碼,提高應用代碼的效率,一方 面可以通過增加參數(shù)shared_pool_size的值。

案例場景四

* 該 指標反映測試數(shù)據(jù)庫的SQL存在很大的性能調(diào)優(yōu)問題?梢酝ㄟ^單擊某個指標,對該指標下的所有值進行

    排序,通過比較,查看SQL總的占用 資源情況

* 通 過向下鉆取功能可以發(fā)現(xiàn)每一條SQL現(xiàn)在和歷史發(fā)生時占用資源和沖突的情況,從而可以預警開發(fā)者如何

   提高SQL的優(yōu)化能力。

案例場景五

* 數(shù)據(jù)庫的Tablespace設計不合理。

* 沒有一個Tablespace是AntoEx,有些表空間的使用率已達到70%,當Percent Utilized達到或接近100%時的

  隱患很大,可能會因為分配數(shù)據(jù)區(qū) 域失敗而終止應用。

更多的數(shù)據(jù)庫性能監(jiān)控的范圍和指標

版權(quán)所有: 2004-2021 卓為科技
粵ICP備20006707號