一个例子方差分析(分析Variance(以下简称ANOVA)用于比较多个群体的平均值。这是由英国统计学家确定的费希尔(费希尔)首先介绍。目前,它已被广泛用于分析心理学、生物学、工程学和医学的实验数据。
消费者与产品生产者、销售者或服务提供者之间经常发生纠纷。当发生纠纷时,消费者通常会问消费者协会抱怨为了评估几个行业的服务质量,消费者协会以零售、旅游、航空和家电制造业的不同企业为样本。其中7人来自零售业,6人来自旅游业,5人来自航空公司,5人来自家电制造业。各行业选择的企业在服务对象、服务内容、企业规模等方面基本相同。然后统计去年消费者对23家企业的投诉数量。结果如下:
问题:我们想知道这些行业的服务质量是否存在显著差异?
一般来说,投诉越多,服务质量越差。
事实上,不同行业的服务质量有四个显著差异(自变量)投诉数目(因变量)是否有重大影响。
相关术语
- 因素:检查对象指上述示例中的行业。
- 级别:上述例子涉及零售业、旅游业、航空业和家电制造业。
- 观察值:在每个因素水平下获得的样本数据是指在上述示例中在每个行业下获得的投诉数量(样本数据)。
1.图形描述
绘制投诉数量和行业分布图,如下图所示。
从散点图可以看出,不同行业的投诉数量存在显著差异,同一行业不同企业的投诉数量也存在显著差异。例如,家电制造业的投诉最多,航空公司的投诉较少,这表明该行业与投诉数量之间存在一定的关系。
说明:上图由Excel绘制,绘制折线图,然后调整样式。
2.误差分解
仅从散点图中观察,无法提供足够的证据证明不同行业的投诉数量存在显著差异。也许这种差异是由抽样的随机性造成的。因此,需要更精确的方法来检验这种差异是否显著,即所谓的方差分析。
在方差分析中,误差用平方和表示。
- 反映所有数据误差的平方和为平方和,记录为SST
- 反应群中误差的平方和称为组内的平方和,也称为误差平方和或残差平方和,记录为SSE
- 反应基团之间的误差平方和称为组间平方和,也称为因子平方和,记录为SSA
- 总错误(SST)=组内错误(SSE)+组间错误(SSA)
根据分析的分类自变量数量,ANOVA可分为单向ANOVA和双向ANOVA。当方差分析只涉及一类自变量时,称为单向方差分析。
例如,四个自变量之间是否存在显著差异,如四个自变量的方差分析。
方差分析分为三个步骤:
1.做出假设
2.施工试验统计
3.统计决策
具体操作如下:
第一步:做出假设
第2步和第3步:构建测试的统计数据和统计决策。具体计算公式及相关理论如下:
与Excel的单因素方差分析注:Excel、SPSS等分析工具可以直接给出分析结果,因此无需研究具体的计算和理论!
让我们通过单向方差来解决上述问题:
问题:我们想知道这些行业的服务质量是否存在显著差异?
第一步:做出假设
第2步和第3步:构建测试统计和统计决策,直接通过Excel的数据分析数据库给出。具体操作如下。
Excel的“数据分析”图书馆需要在这里使用。设置后才能显示。设置方法如下。
1.文件-选项,打开以下对话框并选择外接程序
2.选择“Excel加载项”,点击“开始”按钮,查看分析工具库和分析工具库-VBA
完成上述操作后,“数据分析”按钮将出现在Excel“数据”选项卡的最右侧。
接下来,通过Excel的“数据分析”库进行单因素方差分析:
1.点击数据-数据分析
2.选择单向方差分析
3.输入区域,选择数据区域,选择下图中红色框所示的区域,选中“标志在第一行”(因为我们选择的区域包含字段名),然后选择输出区域下方的任何空格
4.点击确定后,Excel将直接给出单向方差分析的结果
分析结果说明:
Excel给出的分析结果分为两部分:
1.总结
数据的描述性统计:观察值、总和、均值和方差。
2.方差分析表
方差分析的相关结论:
- 组间错误、组内错误和总错误。
- 自由
- 组间差异和组内差异。
- P值和F值。
注:从上面可以看出,方差分析需要大量的计算工作,手工计算非常繁琐。通过Excel的数据分析数据库可以很容易地得出结论。
统计决策:
这里我们主要关注最终的p值。如果P很小(小于0.05),则拒绝原始假设;否则,接受最初的假设。
从这里可以看出,p值约为0.04,这相对较小,因此拒绝了最初的假设,即不同行业的平均投诉数量不完全相同。
结论:不同行业的平均投诉数量并不完全相同,也就是说,行业对投诉数量有重大影响。
你用过方差分析吗?使用什么工具进行方差分析?欢迎留言!
最新评论