统计-如何简单理解单因素方差分析

发布时间:2025-12-10 11:40:53 浏览次数:1

本博文源于《商务统计》,主要探讨如何理解单因素方差分析。首先可以很确定的说方差分析不是针对方差来做分析。

引例:消费者协会对不同企业的服务水平进行点差,测得23家投诉次数如下:

散点图讲解

  • 圆点就是样本投诉服务次数
  • X代表行业内的投诉次数的平均值
  • 水平虚线代表整体的平均值
  • 折线就是将组内平均值连起来

图中的数据在下面每一个都会使用到

方差分析简要介绍

  • 检验多个总体均值是否相等
  • 研究分类型自变量对数值型因变量的影响
  • 方差分析分为单因素方差与双因素方差分析,涉及分类变量数量。单因素只研究一种分类自变量,双因素研究两个分类自变量

题目中的分析目标

分析四个行业的服务质量是否有显著差异,也就是要判断“行业”对投诉次数
是否有显著影响。转化为数学形式就是研究四个行业投诉次数的均值是否相等。

方差分析的相关术语

  • 因素或因子:所要检验的对象
  • 水平或处理:因子的不同表现
  • 观察值:在每个因素水平得到的样本数据
  • 这里:分析行业对投诉次数的影响,行业就是要检验的因子。服务行业的类别就是因子的不同表现。每个行业被投诉的次数就是观察值。

    方差分析中误差平方和SS

    数据的误差用平方和来表示

    • 组内平方和:因素的同一水平下数据误差的平方和
    • 组间平方和:因素的不同水平之间数据误差的平方和

    方差分析的基本假定

    • 每个总体都应服从正态分布
    • 各个总体的方差相同
    • 观察值是独立的

    方差分析假设

    H0:μ1=μ2=μ3=μ4H1:μi(i=1,2,3,4)不全相等H_0:\mu_1=\mu_2=\mu_3=\mu_4\\H_1:\mu_i(i=1,2,3,4)不全相等H0​:μ1​=μ2​=μ3​=μ4​H1​:μi​(i=1,2,3,4)不全相等

    构造检验的统计量

    这里就把引例中的散点图具体数据计算完毕,组内平均值和组间平均值都一一计算。

    总平方和(波动)SST

    组件平方和(组间波动)SSA

    组内均方与组间均方

    组内均方SSA,记为MSA,计算公式
    MSA=SSAk−1MSA=\frac{SSA}{k-1}MSA=k−1SSA​
    组间均方SSE,记为MSE,计算公式
    MSE=SSEn−kMSE=\frac{SSE}{n-k}MSE=n−kSSE​

    • n是指的是所有样本的数量,引例中是23
    • k就是水平,引例中的行业数4

    MSA=1456.6086964−1=485.536232MSE=270823−4=142.526314MSA=\frac{1456.608696}{4-1}=485.536232\\\\\\\\\\MSE=\frac{2708}{23-4}=142.526314MSA=4−11456.608696​=485.536232MSE=23−42708​=142.526314

    F统计量

    组内均方比上组间均方是服从F分布的,因此F统计量的构建是下面这样子的
    F=MSAMSE∼F(k−1,n−k)F=\frac{MSA}{MSE}\sim{F(k-1,n-k)}F=MSEMSA​∼F(k−1,n−k)

    单因素方差分析表

    统计量计算与决策


    理论值F cirt>F值,可以拒绝原假设,也可以因为P值足够小可以拒绝原假设

    总结

    单因素方差分析不是比较方差,而是比较均值是否相等。

    需要做网站?需要网络推广?欢迎咨询客户经理 13272073477