新聞中心
可觀測性不是一個新鮮的名詞,主要是指通過分析數(shù)字化應(yīng)用系統(tǒng)的指標(biāo)(Metrics)、鏈路(Traces)、日志(Logs)等數(shù)據(jù),構(gòu)建出完整的態(tài)勢觀測模型,從而實現(xiàn)快速的威脅發(fā)現(xiàn)和故障診斷。在許多情況下,可觀察性會被錯誤理解成是“系統(tǒng)監(jiān)控”的同義詞,但隨著數(shù)字化應(yīng)用的深入,特別是隨著云原生技術(shù)的發(fā)展,基于容器和微服務(wù)化的應(yīng)用規(guī)模更加龐大,復(fù)雜的云上環(huán)境以及應(yīng)用系統(tǒng)的分布性、復(fù)雜性、動態(tài)性,使得故障定界和檢測分析非常困難,而可觀測性無疑是降低這種難度的有效手段之一。因此,有更多企業(yè)發(fā)現(xiàn)部署可觀察性產(chǎn)品的能力和價值。

讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:國際域名空間、虛擬主機、營銷軟件、網(wǎng)站建設(shè)、鹿泉網(wǎng)站維護、網(wǎng)站推廣。
目前,研究機構(gòu)Gartner已將應(yīng)用可觀測性列為“2023年十大戰(zhàn)略技術(shù)趨勢”之一。安全研究人員表示,成功實現(xiàn)可觀測性的企業(yè)機構(gòu),會在數(shù)字化業(yè)務(wù)開展中建立競爭優(yōu)勢,企業(yè)需要找到合適的工具并盡快部署使用。本文收集整理了8款主流的可觀察性工具,并對其應(yīng)用特性、不足和典型應(yīng)用場景進行了分析,可為企業(yè)組織應(yīng)用選型提供參考。
1. Prometheus
Prometheus是一款開源工具,廣泛用于云原生環(huán)境中的可觀察性獲取。它可以收集和存儲時間序列數(shù)據(jù),并提供可視化工具來分析這些數(shù)據(jù)。
關(guān)鍵特性與不足:
可以從各種來源獲取指標(biāo),包括應(yīng)用程序、服務(wù)和系統(tǒng);
可以將收集到的數(shù)據(jù)存儲在時間序列數(shù)據(jù)庫中,并可以高效地查詢和聚合數(shù)據(jù);
帶有一個內(nèi)置的警報系統(tǒng),可以根據(jù)查詢觸發(fā)警報;
可以自動檢測和抓取運行在多個環(huán)境中的服務(wù)的指標(biāo),比如Kubernetes和其他容器編排系統(tǒng);
能夠與Grafana靈活地集成,允許它創(chuàng)建儀表板來顯示和分析Prometheus指標(biāo)。
不能提供內(nèi)置的根本原因分析;
需要將所有數(shù)據(jù)存儲在內(nèi)存中,因此可能會占用大量計算資源;
目前還不支持嵌套字段和連接。
主要應(yīng)用場景:
- 監(jiān)控指標(biāo)收集和存儲;
- 自動化報警;
- 異常服務(wù)行為發(fā)現(xiàn)。
傳送門:
??https://prometheus.io/??
2. Grafana
Grafana是一個開源工具,主要用于對數(shù)據(jù)的可視化和監(jiān)控。它允許用戶輕松地創(chuàng)建和共享交互式儀表板,對來自不同來源的數(shù)據(jù)進行可視化分析。
關(guān)鍵特性與不足:
- 可以創(chuàng)建定制化的交互式儀表板,對來自各種數(shù)據(jù)源的指標(biāo)和日志進行分析;
- 允許用戶根據(jù)其指標(biāo)的狀態(tài)設(shè)置警報,以發(fā)現(xiàn)潛在的問題;
- 允許用戶設(shè)置異常檢測,并根據(jù)其指標(biāo)中的異常行為自動檢測和警報;
- 允許用戶深入到指標(biāo)中,通過提供帶有歷史上下文的詳細(xì)信息來分析根本原因。
- 不支持長期存儲,需要Prometheus或Elasticsearch等額外工具來存儲指標(biāo)和日志;
- 不提供高級數(shù)據(jù)建模功能;
- 不包含內(nèi)置的數(shù)據(jù)聚合功能。
主要應(yīng)用場景:
- 對各種監(jiān)控指標(biāo)的可視化;
- 自動化報警;
- 異常服務(wù)行為檢測。
傳送門:
??https://grafana.com/??
3. ELK堆棧
ELK堆棧是一款流行的開源可觀察性解決方案,有助于運營人員更好地管理日志和分析數(shù)據(jù)。它由三個組件組成:Elasticsearch、Logstash和Kibana。
Elasticsearch是一個分布式搜索和分析引擎,可以處理大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),使用戶能夠存儲、索引和搜索大量數(shù)據(jù);Logstash是一個數(shù)據(jù)收集和處理管道,允許用戶收集、處理和豐富來自許多源(如日志文件)的數(shù)據(jù);Kibana是一個數(shù)據(jù)可視化和探索工具,允許用戶基于Elasticsearch中的數(shù)據(jù)創(chuàng)建交互式儀表板和可視化。
關(guān)鍵特性與不足:
- 允許用戶收集、處理、存儲和分析來自多個來源的日志數(shù)據(jù)和指標(biāo),同時提供一個集中控制臺來搜索日志;
- 允許用戶搜索和分析相關(guān)日志數(shù)據(jù),這對于解決和深入了解問題的根本原因至關(guān)重要;
- 可以對來自多個數(shù)據(jù)源的日志數(shù)據(jù)和指標(biāo)進行可視化分析;
- 允許在日志數(shù)據(jù)中為異?;顒影l(fā)出警報;
- 允許用戶向下獲取更多日志數(shù)據(jù),通過提供詳細(xì)的日志和歷史上下文,可以更好地找出問題的根本原因。
- ELK目前還不支持分布式跟蹤,用戶需要使用額外的工具,如Jaeger;
- ELK的日志報告會造成輕微的延遲;
- 策略配置和維護過程比較復(fù)雜,需要特定的知識來管理運營。
主要應(yīng)用場景:
- 多來源的日志管理;
- 數(shù)據(jù)可視化;
- 遵從性和安全性監(jiān)控
傳送門:
Elasticsearch:https://www.elastic.co/elasticsearch/
Logstash:https://www.elastic.co/logstash/
Kibana:https://www.elastic.co/kibana/
4. InfluxDB 和Telegraf組合
InfluxDB和Telegraf都是開源版的可觀察性工具,它們的時間序列數(shù)據(jù)存儲和監(jiān)控功能很受企業(yè)用戶的歡迎。其中,InfluxDB是一個時間序列數(shù)據(jù)庫,它使用類似sql的查詢語言存儲和查詢大量時間序列數(shù)據(jù);而Telegraf則是一款性能出色的數(shù)據(jù)收集代理,它可以支持各種數(shù)據(jù)源,收集各種指標(biāo)和事件信息,并將其發(fā)送給多個提前設(shè)置的接收器,比如InfluxDB等。
關(guān)鍵特性與不足:
- Telegraf允許用戶從許多來源收集指標(biāo),并將它們發(fā)送到InfluxDB進行存儲和分析;
- InfluxDB可以與第三方可視化工具(如Grafana)集成,以創(chuàng)建靈活的交互式控制面板;
- InfluxDB的設(shè)計允許它處理較長時間段內(nèi)的數(shù)據(jù)并提供擴展能力;
- 這兩個工具都缺乏警報功能,需要第三方集成來提供警報;
- 缺乏深入的原因分析功能,需要第三方集成。
主要應(yīng)用場景:
- 指標(biāo)收集和存儲;
- 長時間的運行監(jiān)控。
傳送門:
InfluxDB:
??https://www.influxdata.com/??
Telegraf:
??https://www.influxdata.com/time-series-platform/telegraf/??
5. Datadog
Datadog是一款基于云的可觀察性監(jiān)控和分析平臺,目前已被廣泛用于深入了解分布式系統(tǒng)的運行狀況和性能,以便在風(fēng)險真實發(fā)生前排除問題。
關(guān)鍵特性與不足:
- 可以監(jiān)控在AWS、Azure、GCP等多種公有云平臺上運行的應(yīng)用程序;
- 可以對服務(wù)依賴關(guān)系、位置、服務(wù)和容器等信息進行可視化分析;
- 可以跟蹤分析有關(guān)應(yīng)用程序性能的詳細(xì)信息;
- 可以通過提供帶有歷史上下文的詳細(xì)信息,讓用戶分析了解問題的根本原因;
- 可以設(shè)置異常檢測,自動檢測和警告觀測到的異常行為。
- Datadog是一種基于云計算的付費服務(wù),隨著部署規(guī)模擴大,使用費用會增加;
- 不提供默認(rèn)的日志分析支持,用戶必須單獨購買日志攝取和索引功能;
- 不允許用戶在本地或自己的數(shù)據(jù)中心存儲數(shù)據(jù)。
主要應(yīng)用場景:
- 可觀察性數(shù)據(jù)管道
- 分布式服務(wù)跟蹤
- 集裝箱式應(yīng)用監(jiān)測
傳送門:
??https://www.datadoghq.com/??
6. New Relic
New Relic也是一款基于云的監(jiān)控和分析平臺,允許用戶監(jiān)控分布式環(huán)境中的程序運行狀態(tài)。它使用“New Relic Edge”服務(wù)進行分布式跟蹤,可以實現(xiàn)幾乎100%的應(yīng)用程序跟蹤監(jiān)測。
關(guān)鍵特性與不足:
- 提供全面的APM解決方案來監(jiān)控和排除應(yīng)用程序性能故障;
- 可以在AWS、Azure、GCP等多個公有云平臺上監(jiān)控應(yīng)用程序運行;
- 可以提供有關(guān)系統(tǒng)和應(yīng)用程序性能的詳細(xì)信息,并進行跟蹤分析;
- 可以幫助用戶深入到指標(biāo)和上下文信息中,分析問題的根本原因;
- 可以收集、處理和分析各種來源的日志數(shù)據(jù),并提供全面的日志視圖。
- New Relic是一個閉源平臺,它與其他開源工具的集成能力非常有限;
- 在進行大規(guī)模部署時,New Relic的使用成本會比較高。
主要應(yīng)用場景:
- 多云環(huán)境中的應(yīng)用監(jiān)控
- 深入的跟蹤分析
傳送門:
??https://newrelic.com/??
7. AppDynamics
AppDynamics是一款應(yīng)用廣泛的可觀察性監(jiān)控和分析平臺,不僅允許用戶對各種應(yīng)用程序的每個組件進行跟蹤監(jiān)測,同時還提供了根本原因分析,以確定可能影響應(yīng)用程序性能的潛在問題。
關(guān)鍵特性與不足:
- 可以從許多來源(如主機、容器、云服務(wù)和應(yīng)用程序)收集監(jiān)控指標(biāo)并跟蹤分析;
- 可以設(shè)置異常檢測功能,對發(fā)現(xiàn)的異常行為進行及時檢測和預(yù)警;
- 用戶可以獲取較詳細(xì)的性能信息并跟蹤分析;
- 由供應(yīng)商維護工具,對開源工具的集成能力不足;
- 定制選項不夠靈活,用戶不能自己定制解決方案。
主要應(yīng)用場景:
- 應(yīng)用程序性能監(jiān)視
- 多云環(huán)境中的應(yīng)用監(jiān)控
- 業(yè)務(wù)流程管理
傳送門:
??https://www.appdynamics.com/??
8. Helios
Helios是一款為系統(tǒng)開發(fā)人員提供可觀察性的解決方案,提供了對應(yīng)用程序流程的可操作性洞察能力。它整合了OpenTelemetry的上下文連接框架,可以提供跨微服務(wù)、無服務(wù)器應(yīng)用、數(shù)據(jù)庫和第三方API的可見性。
關(guān)鍵特性與不足:
- 在完整的上下文中提供分布式跟蹤信息;
- 使用戶能夠從多個數(shù)據(jù)源收集和可視化跟蹤數(shù)據(jù),以深入挖掘和排除潛在問題;
- 支持Python、JavaScript、Node.js、Java、Ruby等多種語言和框架;
- 允許團隊成員重用請求、查詢和有效負(fù)載;
- 可根據(jù)跟蹤數(shù)據(jù)自動生成測試;
- 與現(xiàn)有的生態(tài)系統(tǒng)輕松集成,包括日志、測試、錯誤監(jiān)控等;
- 只需點擊幾下即可再現(xiàn)一個精確的工作流。
主要應(yīng)用場景:
- 分布式應(yīng)用跟蹤;
- 多語言應(yīng)用程序跟蹤集成;
- 無服務(wù)器應(yīng)用程序監(jiān)控;
- 應(yīng)用測試中的故障排除;
- API調(diào)用自動化。
傳送門:
??https://app.gethelios.dev/??
參考鏈接:
??https://dzone.com/articles/11-observability-tools-you-should-know-in-2023??
網(wǎng)頁題目:提升應(yīng)用可觀察性的八款熱門工具推薦
文章鏈接:http://m.5511xx.com/article/dpgcsjc.html


咨詢
建站咨詢
