集中趋势指标
- 中位数:代表中心
- 最中间的数值
- 群体中位数:小写希腊字 eta
- 样本中位数:小写罗马字 x tilde
- 找中位数之方法:资料重新排序
- n=奇数:(n+1)/2
- n=偶数:n/2和n/2+1的平均数
- 众数(MODE):出现次数最多
- 众数不是唯一的
- 平均、中位数唯一
- 使用场景:
- 平均数对离群值非常敏感,中位数和众数不敏感,因此不使用平均数
- 同时考量平均数和中位数
分散趋势指标
- 分散趋势
- 全距(range)
- R=最大值-最小值
- 出现离群值或样本数很大时,不能很好的衡量
- 相同之全距,不同之分布
- 变异数:离中趋势
- 群体变异数
- 样本变异数:(平方和-和平方/n)/n-1
- 标准差:分散程度
- 群体标准差
- 样本标准差
- 偏态:数据分布的形态
- 对称:平均数=中位数=众数
- 右偏,正偏:众数<中位数<平均数
- 左偏,负偏:平均数<中位数<众数
- 偏态系数
- 样本偏态系数,3次方(无单位量数)
- =0 对称
- >0 右偏
- <0 li="">0>
- 峰度系数
- 4次方(无单位量数)
- =0 常态
- >0 高峡
- <0 li="">0>
数据特征值之应用
- 经验法则:常态分布下,68-95-99.73法则
- 盒须图(box-whisker plot):min,q1,md,q3,max
- 展示资料特征
- 同时比较数组资料
- 集中趋势,离中趋势,形态
- 离群值
No comments:
Post a Comment