鲲鹏devkit性能分析工具介绍(四)

news/2024/4/30 1:40:02/文章来源:https://blog.csdn.net/m0_63694520/article/details/128105476

鲲鹏devkit性能分析工具介绍(四)

前面我们已经介绍了鲲鹏devkit性能分析工具的全景分析、热点函数分析、进程/线程分析、微架构分析、和访存分析,由此可见进行性能调优绝对不能够仅仅去进行一方面的考察而是需要全方面的数据分析进行一定的舍去才能达到最终自己所需要的调优效果

I/O分析

I/O分析以存储块设备为分析对象,分析得出块设备的I/O操作次数、I/O数据大小、I/O队列深度、I/O操作时延等性能数据,并关联到造成这些I/O性能数据的具体I/O操作事件、进程/线程、调用栈、应用层I/O APIs等信息。根据I/O性能数据分析可以给出优化建议。

在这里插入图片描述
在分析报告中数据给出了

  • 以块设备为分析对象,分析得出I/O操作次数、I/O数据大小、I/O队列深度、I/O吞吐率、I/O操作时延等信息。
  • 支持关联I/O操作时的进程/线程及调用栈信息,包括时间、时间、块数、CPU核、进程ID进程名称、调用栈等信息。
  • 支持关联I/O操作时应用层的I/O APIS,包括进程PID、函数名、调用次数、平均执行时间.
    总执行时间、执行时问占比等信息。
  • 基于I/O操作数据分布情况判断是随机操作还是顺序操作,并给出相应的优化建议。

I/O分析原理

在块设备层,通过ftrace工具跟踪内核的tracepoint事件,得到每个I/O操作的全部信息
通过关联这些tracepoint事件,分析得到操作数据大小、操作时延等信息。
针对一段时间内的I/O操作进行统计分析,进一步得到数据块分布、操作时延分布、数据大小分布等等信息。
tracepoint事件只能反映到内核针对I/O的处理,而无法反映应用层的处理(非direct方式)。所以通过获取应用层I/O API调用信息,形成内核层与应用层处理的简单映射,指导应用层的优化,例如通过某个段时间的数据块分布是连续还是随机,优化对应应用层的I/O请求。
支持获取自研盘内部性能数据。
在这里插入图片描述

I/O分析举例

sda的IOPS和吞吐量上不去。通过工具可以获取这段时间内的详细IO操作情况,得到进行IO操作的进程及其调用栈信息,可以得到进行IO操作的进程采用的是同步操作。
在这里插入图片描述
进一步进行IO APIs跟踪可以得到具体的调用信息
在这里插入图片描述

资源调度分析

采集进程/线程对CPU、内存、存储IO等资源的消耗情况,获得对应的使用率、饱和度、错误次数等指标,以此识别性能瓶颈。针对部分指标项,根据当前已有的基准值和优化经验提供优化建议。支持分析单个进程的系统调用情况。
在这里插入图片描述
进程/线程调度信息,识别线程是否频繁上下文切换;cpu是否频繁调度
NUMA节点切换情况,对于频繁切换的,会给出核绑优化建议
分析在进程线程在各个时间的运行情况,能够方便识别频繁上下文切换的线程
分析CPU核在各个时间点的运行状态,如:idle、running等。如果是running状态,能关联在cpu核上运行的进程/线程信息
同时能够高亮显示某个线程在各个cpu核上的运行情况
在这里插入图片描述

资源调度分析原理

分析工具会采集cpu调度事件数据,从进程/线程的角度排列各个事件,计算各个事件之间的时间差,并标记对应的状态
将每个事件进行排序,计算时间差来分析出那些会出现等待时间过长的情况
将事件的状态进行标记,最后进行统计分析
在这里插入图片描述

资源调度分析举例

多线程程序中,线程之间互相抢占,并目出现一个线程长期占用,导致其他线程长期处于等待状态,造成整个程序性能不高。这种情况一般是锁或互斥量被线程长期占用造成
在这里插入图片描述
在视频例子中由于加锁位置不当,导致线程占用资源时间过长,合理的减少加所范围最后使线程能够最大程度的运行起来
在这里插入图片描述

锁与等待分析

锁与等待分析基于Linux perf工具的采样数据,对glibc和开源软件(如MySQL、Open MP)的锁与等待函数(包括sleep、usleep、mutex、cond、spinlock、rwlock、semaphore等)进行分析,关联到其归属的进程和调用点,并根据当前已有的优化经验给出优化建议。
在这里插入图片描述

HPC场景

OpenMP/MPI分析通过采集系统的PMU事件并配合采集面向OpenMP和MPI应用的关键指标,帮助用户精准获得Parallel region及Barrier-to-Barrier的串行及并行时间、校准的2层微架构指标、指令分布及L3的利用率和内存带宽等信息。
1.OpenMP运行时指标,新增细化指标
2.MPI运行时指标
3.top-down微架构指标
4.平均DRAM带宽
5.指令分布 (Instruction Mix)
6. Hotspots
在这里插入图片描述

内存诊断

内存诊断可以分为:

  • 内存泄漏诊断:主要分析应用程序存在的内存泄漏点(包括内存未释放和异常释放),得出具体的泄漏信息,并支持关联出调用栈信息和源码;分析后得出结果信息主要为Call Tree信息、源码信息、内存消耗信息、OOM信息。
  • 内存越界诊断:主要分析应用程序的内存异常访问点,给出异常访问类型和内存访问信息,并支持关联出调用栈和源码。
    在这里插入图片描述

内存诊断原理

采用hook技术实现获取内存申请和释放信息,通过内存地址匹配申请点和释放点,判断是否泄漏或异常释放。其中,针对拉起进程的场景,采用preload加载用于hook函数的动态库;针对附着进程的场景,采用ptrace加载用于hook函数的动态库,并替换GOT PLT表。
在这里插入图片描述
内存越界是通过集成Google AddressSanitizer实现。AddressSanitizer在编译时插桩,对每块内存空间(8字节)增加shadowmemory。对所有的memory access都去检查该内存所对应的shadow memory的状态

调优助手原理

采集的数据覆盖OS、应用、硬件等系统各层的配置和性能指标,并根据硬件资源的消耗,来关联消耗这些硬件资源的软件信息,再从这些软件信息,来查看软件对其他的硬件资源的消耗,从而推断出性能瓶颈。将数据从应用消耗、物理消耗以及硬件关联在一起。
在这里插入图片描述

java性能分析

针对Java程序进行性能分析,能图形化显示Java程序的堆、线程、锁、垃圾回收等信息收集热点函数、定位程序瓶颈点,帮助用户进行问题的定位和性能调优。
Profiling (在线分析)
基于attach技术,实现对目标java程序的内部数据的动态采集。包括Java虚拟机的内部状态,如Heap、GC活动、线程状态以及应用层的相关数据,如热点函数、锁分析、I0等。Sampling(采样分析)
基于JFR技术,通过采样的方式收集JVM的内部活动/性能事件,通过录制及回放的方式来进行离线分析。在默认情况下,JFR的性能损耗小于1%。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_228008.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

8、多进程之间的通信

多进程之间的常用通信方法有两种,及Queue和Pipe 一、Queue Queue([maxsize]):创建共享的进程队列。maxsize是队列中允许的最大项数。如果省略此参数,则无大小限制。底层队列使用管道和锁定实现。另外,还需要运行支持线程以便队列中…

[附源码]计算机毕业设计springboot基于Web的软考题库平台

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

[论文阅读] Curriculum Semi-supervised Segmentation

[论文地址] [代码] [MICCAI 19] Abstract 本研究调查了半监督CNN分割的课程式策略,它设计了一个回归网络来学习图像级信息,如目标区域的大小。这些回归被用来有效地规范分割网络,约束未标记图像的softmax预测,使其与推断的标签分…

16-JavaSE基础巩固项目:拼图小游戏

阶段项目-拼图小游戏 一、项目介绍 1、目的 锻炼逻辑思维能力,让我们知道前面学习的知识点在实际开发中的应用场景。 1、为了学习一个新知识:GUI GUI全称:Graphical User Interface(又称图形用户接口)是指采用图形化…

【Android进阶之旅】内存泄漏的危害有哪些?(案例分析)

随着计算机应用需求的日益增加,应用程序的设计与开发也相应的日趋复杂; 开发人员在程序实现的过程中处理的变量也大量增加,如何有效进行内存分配和释放,防止内存泄漏的问题变得越来越突出 例如: 服务器应用软件&#x…

Redis 内存淘汰和过期删除策略

提起使用Redis的优点,大家可以列举出许多,比如:数据存储在内存,读写速度快,性能优异。比如数据持久化,便于数据备份及恢复等等。 分布式服务系统平台发展至今,Redis活跃在平台的各个领域&#…

RabbitMQ事务消息

通过对信道的设置实现 channel.txSelect();通知服务器开启事务模式;服务端会返回Tx.Select-Ok channel.basicPublish;发送消息,可以是多条,可以是消费消息提交ackchannel.txCommit() ;提交事务;…

mmdetection3d SUN RGB-D数据集预处理

SUN RGB-D是普林斯顿大学发布的一种关于室内场景理解的数据集,共包含了10335个样本,其中训练样本和验证测试样本数量分别为5285和5050。每个样本包含了彩色图像(RGB)和深度(D)信息,并且分别进行…

基于BDD的接口自动化框架开箱即用

1、背景说明 项目思想:BDD 行为驱动开发的思想褒贬不一,这里不多说。遵循的宗旨能解决业务痛点的思想就是好思想。 接口测试工具在实际的业务测试场景中往往会遇到一些使用上的局限性,自定义扩展要求技术较高,如果二次开发工具…

小程序瀑布流实现

什么是瀑布流布局 瀑布流布局,一般等宽,不等高的列表排列 原理是找出高度之和最小的那一列,在高度最小列继续添加元素 可以通过 absolute 定位实现,动态计算每一项的 top 和 left 封装瀑布流方法 function getAllRect(context…

[附源码]Python计算机毕业设计Django的疫苗接种管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

c#、wpf开发中页面在win10下被缩放125%引起页面错乱的解决办法。

正常情况下,我们开发的页面页面应该是100%缩放的,这样程序在win7和win10下保持一致,但是win10里面会根据显示器的情况自动调整“缩放与布局”,这使得桌面程序有时候会发生页面错乱,怎么调整就是个问题。 如图:在“缩放与布局”100%显示如下: 而在 “缩放与布局”125%显…

基于AD Event日志检测LSASS凭证窃取攻击

01、简介 简单介绍一下,LSASS(本地安全机构子系统服务)在本地或域中登录Windows时,用户生成的各种凭证将会存储在LSASS进程的内存中,以便用户不必每次访问系统时重新登录。 攻击者在获得起始攻击点后,需要获取目标主机上的相关凭证…

小程序中的confirm-type设置键盘的确认按钮

详情: confirm-type是很多小程序组件中的一种设置,用于改变输入键盘右下角的确认按钮。比如说,正常情况下,键盘上的默认提示可能是完成,但是你可以通过confirm-type将其设置为发送,搜索等,在特…

搬砖日记:关于sync用不了的问题

自己封装了个输入框的组件&#xff0c;想要实现的输入框的值的修改可以实时修改到父组件的值 印象中看到过人家用.sync修饰符去实现这个功能&#xff0c;大抵是 //父组件 <searchInput :value.sync"value"></searchInput> //子组件 <input v-model&qu…

Redeis缓存查询基于元注解与AOP结合使用——不过时的优雅

Redeis缓存查询基于元注解与AOP结合使用 根据优化需要&#xff0c;数据查询的时候无法避免的使用Redis基于缓存查询&#xff0c;进而减少对于数据库的查询压力&#xff0c;对于过多的方法基于缓存存储&#xff0c;为提高代码的复用性&#xff0c;采用一种不过时的写法。 整体的…

一文详解,数据仓库、数据库、数据中台、数据湖的区别

数据时代&#xff0c;各行业的企业都已经开始通过数据库来沉淀数据&#xff0c;但是真的论起数据库、数据仓库、数据中台&#xff0c;还是新出现的数据湖&#xff0c;它们的概念和区别&#xff0c;可能知道的人就比较少了&#xff0c;今天我们详细来比较了解一下。 数据仓库是…

你的数据库到底应该如何存储密码?

最近接手公司一个之前的服务&#xff0c;竟然发现用户密码是明文存储在数据库中&#xff01; 说实话还是有点吃惊的&#xff0c;这可不兴学 CSDN 呀&#xff08;手动狗头&#xff09;&#xff0c;至少也得搞个 MD5 存一存吧。 不过 MD5 其实也没啥用&#xff0c;今天我们就来…

JVM之运行时数据区 PC、虚拟机栈、本地方法栈

JVM之运行时数据区 PC、虚拟机栈、本地方法栈PC寄存器线程回顾寄存器实践面试使用PC寄存器存储字节码指令地址有什么用&#xff1f;为什么使用PC寄存器记录当前线程的执行地址PC寄存器为什么会被设定为线程私有虚拟机栈虚拟机栈出现背景简介栈可能出现的异常栈中存储着什么运行…

电商新趋势:Starday拿下黑色星期五的制胜法宝是物流速度

国内电商“双十一”购物狂欢季活动已经闭幕&#xff0c;“双十二”又将袭来&#xff0c;但更多人却将眼光放在蓬勃发展的跨境电商行业中。当下跨境电商卖家们正在各大跨境电商服务平台的带领下全力备战&#xff0c;在“黑色星期五”期间推出各类大促活动&#xff0c;奋力冲刺20…