目录
- 一、箱线图介绍
- 二、python函数
- 三、利用数据绘制箱线图
- 四、拓展——未知数据复现箱线图
一、箱线图介绍
箱线图(Box Plot),也称为盒须图、箱形图、盒式图,是一种用于显示数据分布情况的图表。箱线图通常由五条线组成,包括最小值、第一四分位数、中位数、第三四分位数和最大值。其中,箱体表示了数据的四分位数范围,上下各有一个“盒须”表示了数据的范围。
箱线图可以用来检测数据的异常值和数据分布的形状,以及数据集的离散程度。如果数据集中存在离群值,箱线图可以帮助识别它们,因为离群值会显示为图表上的单个数据点。通过比较不同数据集的箱线图,可以快速了解它们的分布情况和中位数、四分位数的差异。
箱线图的结构如下:
方框从数据的第一个四分位数(Q1)延伸到第三个四分位(Q3),中间有一条线。边界从长方体延伸出四分位间距(IQR)的1.5倍。飞点是指那些超过胡须末端的点。参考https://en.wikipedia.org/wiki/Box_plot。
第一四分位数(Q1)