跳到主要内容

R 语言 - 百分位数

百分位数

百分位数在统计中用于为您提供一个数字,该数字描述了给定百分比的值低于的值。

如果我们看一下来自 mtcars 数据集的 wt(重量)变量的值:

观察 wt (weight) 值的排序:

1.5131.6151.8351.9352.1402.2002.3202.465
2.6202.7702.7802.8753.1503.1703.1903.215
3.4353.4403.4403.4403.4603.5203.5703.570
3.7303.7803.8403.8454.0705.2505.3455.424

汽车重量的第 75 个百分位数是多少? 答案是 3.61 或 3 610 磅,这意味着 75% 或汽车重量不超过 3 610 磅。

示例:

Data_Cars <- mtcars

# c() specifies which percentile you want
quantile(Data_Cars$wt, c(0.75))

结果为:

75% 
3.61

如果你在未指定 c() 参数的情况下运行 quantile() 函数,那么将会得到 0、25、50、75 和 100 的百分位数。

示例:

Data_Cars <- mtcars

quantile(Data_Cars$wt)

结果为:

     0%     25%     50%     75%    100% 
1.51300 2.58125 3.32500 3.61000 5.42400

四分位数

四分位数(Quartiles)是指当按升序排序时,位于每个四分之一处的数据。

  1. 第一个四分位数的值截掉前25%的数据
  2. 第二个四分位数的值截掉前50%的数据
  3. 第三个四分位数的值截掉前75%的数据
  4. 第四个四分位数的值截掉前100%的数据

在 R 语言中,使用 quantile() 函数获取四分位数。