百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

线上机器CPU占用高分析实践(线上cpu占用率高怎么办?如何排查这个问题,用哪些命令)

haoteby 2025-03-19 12:50 30 浏览

作者:京东零售 王江波

1. 线程运行状态

1.1 total



1.2 timed_waiting





通过上图我们可以发现timed_waiting的topN线程都是查询国补资质的。

1.3 waiting





通过上图我们可以发现waiting的topN线程都是查询国补活动的。

1.4 线程分析

下面我们分析上述两种状态:

1. WAITING 状态

o定义:当一个线程处于 WAITING 状态时,它在等待另一个线程的特定操作(如通知或中断),并且不会继续执行。

o触发条件:线程进入 WAITING 状态的常见情况包括:

调用 Object.wait() 方法:线程在等待某个对象的监视器(锁)被其他线程通知。

调用 Thread.join() 方法:等待另一个线程完成。

调用 LockSupport.park() 方法:线程被阻塞,直到它被其他线程唤醒。

o恢复:线程在 WAITING 状态下将一直保持此状态,直到其他线程调用 notify() 或 notifyAll()(对于 Object.wait()),或者被中断。

2. TIMED_WAITING 状态

o定义:当一个线程处于 TIMED_WAITING 状态时,它在等待某个条件的发生,但它会在指定的时间后自动返回。

o触发条件:线程进入 TIMED_WAITING 状态的常见情况包括:

调用 Thread.sleep(milliseconds):线程休眠指定的毫秒数。

调用 Object.wait(milliseconds):线程在等待某个对象的监视器(锁),并且在指定的时间内等待。

调用 Thread.join(milliseconds):等待另一个线程完成,但有时间限制。

调用 LockSupport.parkNanos() 或 LockSupport.parkUntil()。

o恢复:线程在 TIMED_WAITING 状态下会在指定的时间结束后自动恢复,或者在其他线程调用 notify() 或 notifyAll() 时恢复。

| 状态           | 描述                                     | 触发条件                                    | 恢复方式                                   |
|----------------|------------------------------------------|---------------------------------------------|--------------------------------------------|
| **WAITING**    | 线程等待另一个线程的特定操作,不会继续执行 | `Object.wait()`, `Thread.join()`, `LockSupport.park()` | 其他线程调用 `notify()`/`notifyAll()` 或被中断 |
| **TIMED_WAITING** | 线程等待某个条件的发生,但有时间限制   | `Thread.sleep(milliseconds)`, `Object.wait(milliseconds)`, `Thread.join(milliseconds)` | 超过指定时间后自动恢复,或其他线程调用 `notify()`/`notifyAll()` |

下面我们结合实际代码情况分析:



上文中 queryActTp 为 getActivityInfo 执行并发任务,其中包含两个子任务、 queryQualityTp 为 getQualityInfo 执行并发任务,其中五个子任务。同时将这俩任务放到queryActAndQualityTp中并行。

getActivityInfo所在的秒级监控如下:



getQualityInfo所在的秒级监控如下;



上文中同样的调用方式,但是出现了两种线程状态,理论上应该都是TIMED_WAITING。针对queryActTp我们可以发现堆栈信息中也是LockSupport.park而不是LockSupport.parkNanos。具体原因有待进一步分析。

上述代码中还有一个问题就是A线程池中又并行调用了B、C线程池,在大流量情况下,CPU频繁切换也会造成一定的CPU压力,我们改写这块逻辑用一个线程池实现活动和资质的并发查询。鉴于改动较大,本次先不动。

2. 火焰图分析



2.1 wait线程



2.2 锁性能



2.3 CPU采样



2.3.1 getFatherActivity分析



Q1:调用场景:循环中调用getFatherActivity

Q2:查看配置数据,json格式化后50000字符,大对象的反序列化

Q3:使用new ArrayList() 创建新对象

Q4:分组后只用了对象中的第一个元素,这里用toMap更佳

优化1:



我们可以发现上文在循环中还是会存在多次的stream调用,继而将toMap逻辑提到循环外,如下:



其他方法确实占用CPU较高,这里先不处理。

下文再优化一项获取并发线程执行结果的工具类:



1、 allOf异常后,取消所有线程的继续执行。这么做为了防止有些线程超时后仍在执行,浪费部分CPU资源,线上发现确实存在较多的超时情况。
2、 这里的异常日志较多,根据异常类型进行区分,去掉没用的堆栈日志。

并发线程中所有的等待统一都使用了上文的方法,前文中的queryActTp处于WAITING状态可能也是执行没取消导致,修改部署后再观察分析。同样的调用方式 queryQualityTp 处于Timed_waiting状态可能与一次父任务中子任务的执行耗时有关,见上文监控,活动和资质相差较大,具体原因有待进一步分析。

相关推荐

半年做到美妆Top主播,“成分测评师李某人”究竟何许人?

从毛毛姐到口红一哥李佳琦,男网红主播成为了一个趋势,也有越来越多的男生开始扎堆进入美妆行业,淘宝主播“成分测评师李某人”是其中之一。只是,他做主播的初衷,倒不是为了当网红,而是想给自己的美妆品牌打开一...

《经典怀旧手游》新手必看玩法,背景玩法详细介绍!

经典重温,武林再现,十年经典,再创江湖!备受玩家期待的《武林外传十年之约手游》即将来袭。本次版本主题为“江湖再现”,全新开放的梦境机关城将带来全新挑战!塑魂系统的全面升级,新增第二期空位和道具将大幅提...

17个问题,帮你判断咨询师是否适合自己

...

关于软考你想知道的都在这(软考有用吗 知乎)

软考相信学计算机的大家多多少少有过了解,就是全国计算机技术与软件专业技术资格(水平)考试,适用于大部分计算机同学和想转行IT行业的同学。这两天各省陆续出了报考的入口,大家可以积极报考!软考含金量较高,...

微软面向Linux平台放出4.3版本Skype

继日前微软针对iPhone平台放出5.0版本Skype,对用户界面进行多处调整之后软再次面向Linux平台放出了4.3.0.37版本Skype应用,带来了部分用户界面改善、全新的功能和系统后台性能优化...

Linux dd命令有多强大?(linux的dig命令)

请关注本头条号,每天坚持更新原创干货技术文章。如需学习视频,请在微信搜索公众号“智传网优”直接开始自助视频学习1.前言本文主要介绍Linuxdd命令的强大功能与日常的使用案例。Linux中的dd命...

Ubuntu 21.10开始利用zstd压缩Debian软件包

随着今年秋天Ubuntu21.10的推出,Debian软件包将通过zstd进行压缩,以提供更快的解压速度,这比最初的计划晚了三年。在过去的三年里,zstd支持被添加到Ubuntu的APT和dpkg中...

Linux发行版Nobara更新39版本,号称“专为游戏玩家定制”

IT之家12月27日消息,Linux发行版Nobara今天推出了39版本,主要改进了“Gamescope合成器”,并更新了OBSStudio、部分驱动程序及Nautilus...

徐睿知「薄纱透出内衣」 好身材热舞挡不住! 出道11年首办见面会

记者张筱涵/综合报导南韩演员徐睿知日前举办了出道11年以来的首场粉丝见面会《2024SEOYEAJI1STFANMEETING》。活动中不仅与粉丝亲密互动,还展现了她的全方位魅力,穿着性感热...

iphone已停用,保资料解决教程(一)

如果你也遇到苹果手机因为小孩乱按被锁住的经历,而且手机里有亲人或者孩子的资料,那种解不开失落、难过、失落的心情只有经历的人才懂得,我不是什么专业人士,只是凭着这对手机资料的执念,花费了大量的经历和时间...

没有 NAS 也能体验飞牛 fnOS?(飞牛fly以前照片)

前言最近飞牛的fnOS非常的火,许多准备自组NAS或者正在使用黑群晖的小伙伴都在考虑要不要使用飞牛fnOS。如果你正好有VPS的话,不妨试试在VPS安装fnOS先体验一下这个系统...

【衣帽间】遮阳又时尚 这十二款帽子戏法等你来变

出门前发现烈日当空又懒得打伞;宅家里几天了不想洗头,却突然接到邀约;总觉得造型缺些亮点或是无精打采的……这些情况通通都可以用一个神奇单品来解决——帽子。无需太多技巧,它便能让整个造型马上加分。一些打扮...

万物之源的Debian_最适合人类使用的Linux

2014-08-1805:24:52作者:张浩Debian广义的Debian是指一个致力于创建自由操作系统的合作组织及其作品,由于Debian项目众多内核分支中以Linux宏内核为主,而且Deb...

KDE、Gnome 和 XFCE,各个 Linux 桌面环境的使用情况如何?

...

Raycast Windows 版测试逐步向用户开放

#RaycastWindows版测试逐步向用户开放用快捷键调用工具,用AI自动化任务,通过Raycast强大的Mac应用程序提升效率...Raycast今日起逐步向Windows用户开放其效率工...