• 监控是一种对计算机系统和应用程序进行实时、持续的管理和控制的方法,通过收集和分析各种指标数据可以及时发现和解决系统的性能问题、故障和安全事件,保证系统的稳定运行和高效运作。监控分为多个维度,包括系统层、调用量、转化率等。在Java程序中,可以使用工具和框架如Pinpoint、SkyWalking等进行监控。探针是一种用于监测系统状态或收集性能数据的软件工具,通过不同的方式来监测系统,如监测CPU利用率、内存占用等。SkyWalking是一种开源
    • 1年前
  • 微服务应用与单块应用完全不同,一个微服务系统少则有几十个微服务组成,多则可能有上百个服务。调用链监控在微服务监控领域被证明是有效的手段,它可以实时监控服务调用性能和跟踪服务依赖关系,帮助快速定位和排障问题。互联网企业有三款主流的调用链监控产品,对于调用链监控,除了调用链监控,APM报表能力也很重要。
    • 1年前
  • 该文章介绍了IT行业采用链路调用工具的思路和实践,并针对分布式追踪系统的整合问题提出了OpenTracing的解决方案。文章还比较了几款常用的链路追踪工具,并介绍了CAT工具的部署和接入过程。最后,对CAT链路工具的应用进行了总结和理解。
    • 1年前
  • 面试问题: 1、你们的监控方案怎么设计的?如何分析定位响应时间慢的问题? 2、线程阻塞、压力上不去、内存泄漏的问题你是怎么定位的? 这个最常见的问题,很少有回答让面试官满意的,来吧,这里给你答案。 这篇文章讲解响应时间拆分的环境部署,下篇文章介绍如何定位JVM线程阻塞问题。 这套环境你能部署下来,薪资多要3K以上没问题 Skywalking是目前最强大的全链路分布式性能管理监控方案,它具有覆盖前端页面以及Java、.Net Core、PHP、N
    • 1年前
  • 文章讨论了面试性能岗位的必问知识点,包括压测服务器和性能指标监控。在压测服务器的场景中,通过使用grafana+prometheus+node_exporter+influxdb等工具来设计压力曲线模型。在性能指标监控的分析中,提到了吞吐量始终保持较小,响应时间快速变长的情况,暴露了性能瓶颈问题。最后,通过查看操作系统的资源消耗情况和进行代码瓶颈定位来解决问题。
    • 1年前
  • 本文介绍了使用Maxserver制作炫酷的运维大屏的方法,从安装配置Zabbix 5.0开始,到完成Maxserver部署,登录系统,进行资产分类和监控网格的创建等步骤,最后展示了服务器监控大屏和详细监控信息,并提到了可以进行资源对比的功能。
    • 1年前
  • 本篇学习目标:zabbix请运维朋友认真看完,真的很详细(虽然是5.0版本的) 一、zabbix的基本概述 Zabbix是一款功能强大的监控软件,可以监控各种网络参数,确保企业的服务架构安全运营。它还提供灵活的告警机制,使运维人员能够快速定位故障并解决问题。Zabbix支持分布式功能,适用于复杂架构下的监控解决方案,并且提供了直观的web页面,以便清晰展示主机监控情况。 zabbix官网地址为https://www.zabbix.com/,页
    • 1年前
  • 作为IT工程师,我经常听到许多运维同事就Prometheus和Zabbix之间的优劣进行争论。然而,我认为,在没有考虑到实际应用场景的情况下,对技术进行优劣的讨论实际上毫无意义。 Zabbix 适合的监控场景 监控的维度 在确定选择特定的监控平台之前,首先需要明确我们的监控目标是什么。我认为监控可以从两个维度进行划分:监控的范围和监控的详尽程度。 ①监控的广度 大家所需要监控的系统少则几种,多则几十种,比如需要监控硬件、存储、操作系统、中
    • 1年前
  • 本文通过阿里的Eagleeye(鹰眼)和开源的Skywalking,从数据模型、数据埋点以及数据存储三个方面介绍分布式链路监控系统的实现细节,其中将重点介绍Skywalking字节码增强的实现方案。 背景 随着业务体量的增大,传统的大型单体系统很难满足市场对技术的需求。因此,通过将整个业务系统拆分为多个互相依赖的子系统,并对每个子系统进行独立优化,可以有效提高整个系统的吞吐量。在进行系统拆分之后,完整的业务事务逻辑被分布部署在多个子系统
    • 1年前
  • 本文介绍了web性能监控的指标、分类和分析方法,包括合成监控和真实用户监控两种方式。其中,合成监控利用浏览器模拟器加载网页进行性能指标采集,而真实用户监控则收集真实用户的性能数据。同时,文章还介绍了performance API提供的性能监控数据来源和浏览器支持情况。最后,文章提供了不同的方法来计算首屏渲染时间。
    • 1年前