统计学基本概念
统计学是收集、整理、分析和解释数据的科学!理解统计学的基本概念,是学习概率与统计的基础。
什么是统计?
统计(Statistics)是收集、整理、分析和解释数据的科学。根据经济学家和抽样方法先驱阿瑟-里昂-鲍利(Arthur Lyon Bowley)的说法,统计学是「对调查事件的量化描述,并将之与其他事件进行联系」。
简单来说,统计就像"从数据中找规律":
- 收集数据
- 整理数据
- 分析数据
- 得出结论
总体和样本
总体
总体(Population)是研究对象的全体。
例子:
- 所有中国人的身高
- 所有学生的成绩
- 所有产品的质量
样本
样本(Sample)是从总体中抽取的一部分。
例子:
- 随机抽取 1000 个中国人的身高
- 随机抽取 50 个学生的成绩
- 随机抽取 100 个产品的质量
关系
- 总体是完整的集合
- 样本是总体的子集
- 通过样本推断总体
参数和统计量
参数
参数(Parameter)是反映总体特征的统计指标,是描述总体特征的数值,是固定的常量。
例子:
- 总体均值
- 总体方差
- 总体比例
统计量
统计量(Statistic)是反映样本特征的统计指标,是描述样本特征的数值,是在参数附近波动的随机变量。
例子:
- 样本均值
- 样本方差
- 样本比例
关系
- 参数是总体的特征(通常未知),是固定的常量
- 统计量是样本的特征(可以计算),是随机变量
- 用统计量估计参数
统计资料分布
统计资料分布(Statistical Distribution)是数据的分类方式:
计量资料
计量资料(Quantitative Data)是可以用数值表示的数据,如身高、体重、温度等。
定性资料
定性资料(Qualitative Data)是用类别表示的数据,如性别、颜色、类型等。
计数资料
计数资料(Count Data)是可以用计数表示的数据,如人数、件数等。
等级资料
等级资料(Ordinal Data)是有顺序的类别数据,如成绩等级(优秀、良好、及格)、满意度(非常满意、满意、一般、不满意)等。