![]() |
新聞中心
當前位置:網站(zhàn)首頁 > 新聞中心
想知(zhī)道(dào)SaaS運行好(hǎo)不好(hǎo)?你(nǐ)得讀懂這(zhè)三類分析指标!
分析指标是所有現(xiàn)代SaaS應用(yòng)程序的核心。如果不監控SaaS應用(yòng)程序如何運行、它在内部執行的任務及其實現(xiàn)目标的成功率,就無從(cóng)談起成功運行SaaS應用(yòng)程序。
然而,現(xiàn)代應用(yòng)程序需要監控和(hé)查看(kàn)多種類型的分析指标。這(zhè)些(xiē)分析指标的用(yòng)途、價值、準确性和(hé)可靠性相差懸殊,具體取決于如何衡量它們、如何使用(yòng)它們以及誰在使用(yòng)它們。
基本上(shàng)有三類用(yòng)例全然不同的分析指标。
A類分析指标
A類分析指标對(duì)應用(yòng)程序而言是關鍵指标。如果沒有這(zhè)些(xiē)分析指标,你(nǐ)的應用(yòng)程序可能(néng)會(huì)立即失靈。這(zhè)類指标用(yòng)于評估應用(yòng)程序的運行,調整其運行方式,并進行動态調整以保持應用(yòng)程序正常運行。
分析指标是反饋回路的一部分,反饋回路可以不斷監控和(hé)改進應用(yòng)程序的操作(zuò)環境。
A類分析指标的一個典例是用(yòng)于自(zì)動擴展的指标。這(zhè)類指标用(yòng)于在應用(yòng)程序負載變化時(shí)動态改變基礎設施的規模,以滿足當前或預期的需求。
一個衆所周知(zhī)的例子是AWS Auto Scaling雲服務。該服務可自(zì)動監控特定的Amazon CloudWatch指标,尋找觸發器和(hé)阈值。如果某個特定的指标達到(dào)特定标準,AWS Auto Scaling 會(huì)爲應用(yòng)程序添加或删除Amazon EC2實例,自(zì)動調整用(yòng)于運行應用(yòng)程序的資源。需要額外(wài)資源時(shí),它會(huì)添加實例;指标表明(míng)不再需要資源時(shí),它會(huì)删除這(zhè)些(xiē)實例。
AWS Auto Scaling讓你(nǐ)可以創建由任意數量的EC2實例組成的服務,并根據流量和(hé)負載需求自(zì)動添加或減少服務器。流量較小(xiǎo)時(shí),将使用(yòng)較少的實例。流量較大(dà)時(shí),将使用(yòng)更多的實例。
舉例來(lái)說,AWS Auto Scaling可能(néng)使用(yòng)CloudWatch指标來(lái)測量用(yòng)于服務的所有實例的平均CPU負載。一旦CPU負載超過某個阈值,AWS Auto Scaling就會(huì)向服務池添加額外(wài)的服務器。
請(qǐng)注意,如果由于某個原因,這(zhè)些(xiē)Amazon CloudWatch指标不可用(yòng)或不正确,那麽算(suàn)法就無法正常運行。結果是,要麽爲服務添加過多的實例這(zhè)會(huì)浪費資金(jīn);要麽爲服務添加過少的實例這(zhè)會(huì)導緻應用(yòng)程序的速度減慢或徹底失效。
很(hěn)顯然,這(zhè)些(xiē)指标确實必不可少。如果它們不可用(yòng)、不正确,應用(yòng)程序的運行就會(huì)岌岌可危。正因爲如此,它們才叫A類指标。
AWS Elastic Load Balancing是另一個典例。AWS可以根據當前進入到(dào)每個負載均衡系統的流量大(dà)小(xiǎo),自(zì)動調整針對(duì)特定用(yòng)例運行流量負載均衡服務所需要的實例大(dà)小(xiǎo)和(hé)數量。随着流量增加,負載均衡系統自(zì)動改用(yòng)更大(dà)的實例或更多的實例。随着流量減少,負載均衡系統自(zì)動改用(yòng)更小(xiǎo)的實例或更少的實例。這(zhè)一切都是自(zì)動化的,基于使用(yòng)特定CloudWatch指标的内部算(suàn)法。如果這(zhè)些(xiē)指标不可用(yòng)或不正确,負載均衡系統将無法調整适當的大(dà)小(xiǎo),負載均衡系統處理(lǐ)流量負載的能(néng)力可能(néng)會(huì)受到(dào)影響。
B類分析指标
B類分析指标不是關鍵業務型指标,是用(yòng)來(lái)表明(míng)即将發生的問題的早期指标,或用(yòng)于在問題出現(xiàn)時(shí)解決問題。B類分析指标對(duì)于防止系統故障或出現(xiàn)故障後恢複正常很(hěn)重要。
B類指标通常便于深入了(le)解應用(yòng)程序或服務的内部操作(zuò),或者便于深入了(le)解運行應用(yòng)程序或服務的基礎設施。你(nǐ)可以主動或被動地利用(yòng)這(zhè)種洞察力,改進應用(yòng)程序或服務的運行。
就主動方面而言,用(yòng)戶可以密切關注B類指标,這(zhè)類指标表明(míng)了(le)應用(yòng)程序或服務可能(néng)不正常的趨勢。基于這(zhè)些(xiē)趨勢,可以利用(yòng)指标觸發警報(bào),提醒運營團隊必須檢查系統,查看(kàn)可能(néng)出現(xiàn)的問題。
就被動方面而言,在系統故障或性能(néng)降級期間,可以檢查B指标的以往情況,以确定可能(néng)導緻故障或性能(néng)問題的原因,以便查明(míng)解決問題的方法。這(zhè)類指标常常在站(zhàn)點出現(xiàn)故障期間使用(yòng),并在事(shì)後檢查期間使用(yòng)。
在出現(xiàn)故障期間,B類指标用(yòng)于迅速查明(míng)出了(le)什(shén)麽問題以及如何解決問題。之後,它們用(yòng)于縮短平均檢測時(shí)間(MTTD)和(hé)平均修複時(shí)間(MTTR),前者是指故障期間發現(xiàn)問題所花(huā)的平均時(shí)間,後者是指故障期間确定解決問題所花(huā)的時(shí)間。這(zhè)兩個都是高(gāo)性能(néng)SaaS應用(yòng)程序的關鍵目标。
這(zhè)種指标與A類指标的危急程度不一樣。如果A類指标失效,你(nǐ)的應用(yòng)程序可能(néng)失靈,但(dàn)是如果B類指标失效,你(nǐ)的應用(yòng)程序不會(huì)失靈。然而,如果你(nǐ)的應用(yòng)程序有問題,而且B類指标沒有正常運作(zuò),你(nǐ)可能(néng)需要更長的時(shí)間才能(néng)找到(dào)問題并解決它。
B類指标的例子有很(hěn)多,許多公司專注于生成這(zhè)些(xiē)指标,比如AppDynamics、Datadog、Dynatrace和(hé)New Relic。B類指标還包括來(lái)自(zì)Elastic和(hé)Splunk等公司的日志記錄及其他(tā)指标。
作(zuò)者:Lee Atchison 是雲計(jì)算(suàn)和(hé)應用(yòng)程序現(xiàn)代化領域公認的思想領袖。他(tā)在産品開(kāi)發、架構設計(jì)、規模擴展和(hé)現(xiàn)代化方面擁有30多年的經驗,曾供職于亞馬遜、亞馬遜網絡服務(AWS)、New Relic及其他(tā)現(xiàn)代應用(yòng)程序組織。他(tā)的名字出現(xiàn)在許多出版物中,經常在全球各地受邀擔任演講嘉賓。Lee的最新著作(zuò)是《爲規模設計(jì)架構》。
作(zuò)者:Lee Atchison? ?來(lái)源:計(jì)算(suàn)機世界
上(shàng)一篇 如何通過雲安全态勢管理(lǐ)保障雲端數據安全和(hé)抵禦網絡威脅 下(xià)一篇 數據管理(lǐ)和(hé)保護雲原生的未來(lái)
|