R 语言 - 百分位数
百分位数
百分位数在统计中用于为您提供一个数字,该数字描述了给定百分比的值低于的值。
如果我们看一下来自 mtcars
数据集的 wt
(重量)变量的值:
观察 wt (weight) 值的排序:
1.513 | 1.615 | 1.835 | 1.935 | 2.140 | 2.200 | 2.320 | 2.465 |
---|---|---|---|---|---|---|---|
2.620 | 2.770 | 2.780 | 2.875 | 3.150 | 3.170 | 3.190 | 3.215 |
3.435 | 3.440 | 3.440 | 3.440 | 3.460 | 3.520 | 3.570 | 3.570 |
3.730 | 3.780 | 3.840 | 3.845 | 4.070 | 5.250 | 5.345 | 5.424 |
汽车重量的第 75 个百分位数是多少? 答案是 3.61 或 3 610 磅,这意味着 75% 或汽车重量不超过 3 610 磅。
示例:
Data_Cars <- mtcars
# c() specifies which percentile you want
quantile(Data_Cars$wt, c(0.75))
结果为:
75%
3.61
如果你在未指定 c()
参数的情况下运行 quantile()
函数,那么将会得到 0、25、50、75 和 100 的百分位数。
示例:
Data_Cars <- mtcars
quantile(Data_Cars$wt)
结果为:
0% 25% 50% 75% 100%
1.51300 2.58125 3.32500 3.61000 5.42400
四分位数
四分位数(Quartiles)是指当按升序排序时,位于每个四分之一处的数据。
- 第一个四分位数的值截掉前25%的数据
- 第二个四分位数的值截掉前50%的数据
- 第三个四分位数的值截掉前75%的数据
- 第四个四分位数的值截掉前100%的数据
在 R 语言中,使用 quantile()
函数获取四分位数。