• 以下内容来自腾讯工程师 kevin 导语 | Prometheus是一款开源的全面监控解决方案,本文将对其不同方面进行介绍,包括数据收集、查询和可视化展示以及监控告警,以便更好地理解该工具。 1. 简介 Prometheus is a deity from ancient Greek mythology, belonging to the Titan clan. His name, "Prometheus," translates to "f
    • 1年前
  • Prometheus被称为“下一代监控”的原因,主要是因为它提供了一些现代、独特的特性,例如基于时间序列的数据模型、灵活的查询语言以及强大的集成能力,这些都使得Prometheus在监控领域具有很高的声誉。 首先,Prometheus使用了一个基于时间序列的数据模型,这使得它可以轻松地处理大量的监控数据,并且能够对这些数据进行高效的分析和查询。此外,Prometheus的查询语言PromQL非常灵活和强大,用户可以轻松地自定义查询和报警规则,从
  • 写在前面 前短时间发了一篇文章讨论《如何构建IT监控管理体系?(一)IT监控管理流程设计》,其中给大家留了一个预告,说会写一篇《如何使用SRE的实践来落地ITIL4的“事态和监控管理实践”》。在这之前先给大家从监控的视角介绍下SRE以便于能够更好的利用SRE的实践思想落地ITIL4的“事态和监控管理实践”。 导入:SRE的来源 十多年前,Google创造了一种名为SRE(Site Reliability Engineering)的工作职位。SR
    • 1年前
  • 文章介绍了Zabbix拓扑图的作用,可以用来快速知道故障范围的详细信息,并准确判断故障影响。同时还提到了拓扑图元素的添加。
    • 1年前
  • 本文介绍了Zabbix系统中的网络拓扑图功能,并详细说明了如何定义和配置网络拓扑图。通过拓扑图能够直观清晰地监控整个网络的状态,并快速发现和定位故障节点,提高工作效率。文章还介绍了如何创建聚合图形,通过聚合图形可以在一个页面上显示多个数据图表,方便了解多组数据。
    • 1年前
  • DevOps体系是原始运维发展到提高效率、解决沟通协作问题的阶段,其中重要的是规范和制度的建设,以及搭建一套自动化系统。运维人员需要逐渐转岗至业务运维,最终目标是以运维平台和业务运维为核心,实现技术运营。设计一套DevOps运维服务体系需要定业务规范、建工作制度、搭建DevOps系统。
    • 1年前
  • 监控是一种对计算机系统和应用程序进行实时、持续的管理和控制的方法,通过收集和分析各种指标数据可以及时发现和解决系统的性能问题、故障和安全事件,保证系统的稳定运行和高效运作。监控分为多个维度,包括系统层、调用量、转化率等。在Java程序中,可以使用工具和框架如Pinpoint、SkyWalking等进行监控。探针是一种用于监测系统状态或收集性能数据的软件工具,通过不同的方式来监测系统,如监测CPU利用率、内存占用等。SkyWalking是一种开源
    • 1年前
  • 微服务应用与单块应用完全不同,一个微服务系统少则有几十个微服务组成,多则可能有上百个服务。调用链监控在微服务监控领域被证明是有效的手段,它可以实时监控服务调用性能和跟踪服务依赖关系,帮助快速定位和排障问题。互联网企业有三款主流的调用链监控产品,对于调用链监控,除了调用链监控,APM报表能力也很重要。
    • 1年前
  • 该文章介绍了IT行业采用链路调用工具的思路和实践,并针对分布式追踪系统的整合问题提出了OpenTracing的解决方案。文章还比较了几款常用的链路追踪工具,并介绍了CAT工具的部署和接入过程。最后,对CAT链路工具的应用进行了总结和理解。
    • 1年前
  • 面试问题: 1、你们的监控方案怎么设计的?如何分析定位响应时间慢的问题? 2、线程阻塞、压力上不去、内存泄漏的问题你是怎么定位的? 这个最常见的问题,很少有回答让面试官满意的,来吧,这里给你答案。 这篇文章讲解响应时间拆分的环境部署,下篇文章介绍如何定位JVM线程阻塞问题。 这套环境你能部署下来,薪资多要3K以上没问题 Skywalking是目前最强大的全链路分布式性能管理监控方案,它具有覆盖前端页面以及Java、.Net Core、PHP、N
    • 1年前
加入SkyWalking技术群聊 ad

关注我们

关注纵目科技公众号

一体化运维观测

全链路应用性能监控

热门文章