开始学习
< 返回

R 语言 – 百分位数

百分位数

百分位数在统计中用于为您提供一个数字,该数字描述了给定百分比的值低于的值。

如果我们看一下来自 mtcars 数据集的 wt(重量)变量的值:

观察 wt (weight) 值的排序:

1.513 1.615 1.835 1.935 2.140 2.200 2.320 2.465
2.620 2.770 2.780 2.875 3.150 3.170 3.190 3.215
3.435 3.440 3.440 3.440 3.460 3.520 3.570 3.570
3.730 3.780 3.840 3.845 4.070 5.250 5.345 5.424

汽车重量的第 75 个百分位数是多少? 答案是 3.61 或 3 610 磅,这意味着 75% 或汽车重量不超过 3 610 磅。

示例:

Data_Cars <- mtcars

# c() specifies which percentile you want
quantile(Data_Cars$wt, c(0.75))

结果为:

75% 
3.61

如果你在未指定 c() 参数的情况下运行 quantile() 函数,那么将会得到 0、25、50、75 和 100 的百分位数。

示例:

Data_Cars <- mtcars

quantile(Data_Cars$wt)

结果为:

     0%     25%     50%     75%    100% 
1.51300 2.58125 3.32500 3.61000 5.42400 

四分位数

四分位数(Quartiles)是指当按升序排序时,位于每个四分之一处的数据。

  1. 第一个四分位数的值截掉前25%的数据
  2. 第二个四分位数的值截掉前50%的数据
  3. 第三个四分位数的值截掉前75%的数据
  4. 第四个四分位数的值截掉前100%的数据

在 R 语言中,使用 quantile() 函数获取四分位数。

文章目录