我相信你对研究并不陌生。当你打电话给客服时,总是加上“请评论我的服务。非常满意,请按1…”;随意点外卖,我不会忘记告诉你“请给我一个五星级的表扬”;当你外出住在五星级酒店时,电子账单中还附带“入住满意度调查”。你可以在最后一道填空题中吐出你是否满意。如果你在某些领域有专业知识,或对某些产品感兴趣和了解,你还将被邀请参加技术趋势研究、产品内部测试研究、用户体验研究等。即使是一个9到5岁的员工在忙碌一年后也会被公司邀请。”员工满意度”调查研究。
作为被调查的你和我,他可能已经感觉到,到目前为止,基于问卷的研究已经广泛应用于各种企业和学术研究中,因为这种方法仍然可以全面、系统地了解不同群体的认知、态度、观点和行为。从学习到求职,小编一路学习了很多问卷调查的分析方法。今天的小编总结了日常工作中最常见的两类问题的分析方法。一个成功的问卷调查也离不开前期的精心设计和分发。如果你对这个话题感兴趣,请留言“问卷调查数据分析前传”。
●第一类问题:评分问题
这类问题的优点是以直观的方式量化抽象的行为和观点。例如,“在1-10分的范围内,请评论此入住体验(1分为最低,10分为最高)”。
对于此类可量化的数字评分问题,可首先计算平均分数,以评估整体值机体验。例如,我有一组数据显示,一家酒店的整体入住体验得分为6.3,属于中等水平。我们还可以根据不同的群体进行进一步的交叉分析,以了解差异。例如,入住体验根据客人的居住地进行划分:
经过交叉分析,我们发现来自不同城市的客人在入住体验上的得分确实不同。杭州客人的分数很高,而北京客人的分数很低。此时,我们要做的是描述性分析,它概述了我们收集的样本数据的外观。小编认为,连续数值数据的计算总是存在一些差异。这种差异有意义吗?我们能否得出结论,杭州客人的入住体验优于北京客人?
我们可以通过统计分析进一步验证不同城市的客人入住体验是否存在显著差异。具体思路是先提出原始假设:不同城市的客人入住体验没有显著差异,然后用单因素方差分析检验样本数据集并计算p值。如果p值大于;0.05,原来的假设是正确的,即不同城市的客人入住体验没有显著差异;否则,拒绝接受来自不同城市的客人入住体验存在显著差异的原始假设。
根据样本数据计算的P值=0.2272>;0.05,所以最初的假设是正确的,即来自不同城市的客人的入住体验没有显著差异。这种一步统计检验有助于我们验证样本数据在统计上不显著。圈出两个关键词:一个是“显著”,另一个是“统计显著性”。描述性分析可以帮助我们发现是否可以忽略这些差异。但这样的测试只能从统计学角度给出解释。如果业务部门从其他数据或采访中得知差异是一把石锤,它也需要我们的关注。
●第二类问题:规模问题
还是上面的问题,小编用另一种方式问:“你觉得这次登机体验怎么样?”然后请选择“A.非常满意B.满意C.没关系D.不满意E.非常不满意”。这种形式的问题是我们接下来要讨论的利克特量表。简单的五个选项是美国社会心理学家伦西斯·利克特早在1932年就发明的一种分析受访者态度、观点或情绪的方法。与评分问题不同,这里的五个选项代表五个类别。我们不能直接进行数值计算,但可以通过描述性分析来描述其分布。例如,在转换上述样本数据后,获得对登机体验的态度分布:
同样,我们还对入住客人的住所进行了交叉分析,得出以下结果:
以上比例分布图显示了不同城市的客人对入住体验的不同态度。想想那些小家伙”不满意的”以及“非常不满意”人口比例较大的城市值得关注。(例如深圳)如果我们还想使用统计分析来测试态度差异是否显著,我们应该如何操作?
由于量表问题的数据类型是不连续的类别变量,我们需要行-列卡方检验来检测。还提出了原始假设:不同城市的客人在入住体验态度上没有显著差异,然后使用行-列卡方检验(RXC-chi-Nicholas-Tse检验)对样本数据集进行检验并计算p值。如果p值大于;0.05,原来的假设是正确的,即不同城市的客人在入住体验态度上没有显著差异;否则,拒绝原来的假设,即来自不同城市的客人的态度存在显著差异。
各城市客人对入住体验的态度分布:
行-列卡方检验分析结果:
结论:P值=0.2262>;0.05,所以最初的假设是正确的,也就是说,来自不同城市的客人的入住体验没有显著差异。
最后,小编会说一个关于规模问题缺点的长句。假设你收到了一份包含100个量表问题(极端例子)的问卷,每个问题有五个态度类别。当你回答问题20时,你可能对“非常同意”、“同意”和“不同意”感到困惑?或者“非常不同意”??!此时,一些受访者会采取极端省力的做法,比如选择所有特定类型的选项。小编不提倡这种做法,因为结果不可信,应该扔进垃圾箱。当然,小编不会提倡设计一份自始至终都带有量表问题的问卷。由于这样一份单一而冗长的问卷很容易引起被调查者的疲劳,随机答案是不可避免的。因此,每当你遇到音阶问题时,小编都会使用克朗巴赫';Sα系数检验返回问卷的质量。例如,让我们来看看这个例子。共有6个量表问题,每个问题有5个类别,8名受访者给出了回答:
克朗巴赫';Sα系数的范围为0到1。根据我们的样本数据计算的内部一致性值为0.87,这是一个相对较高的值。如果问题1-6具有良好的一致性,根据我们的测试结果,我们可以得出结论,返回的问卷的可靠性较高;如果问题1-6没有逻辑关系或相反的关系,测试结果告诉我们,返回问卷的可信度很低,大多数受访者出于某些原因选择“一个答案到底”。基于十多年的行业积累,结合互联网大数据技术,坚持“数据、信息、知识、智慧”的方法论,坚持“用数据说话、用数据决策、用数据管理、用数据创新”的理念,依托已获得国家发明专利的易研问卷平台和易研大数据云平台自主研发,重点提供教育科研机构,政府企事业单位基于数据采集、数据清理、数据检索、数据管理、数据分析与可视化、数据资源整合等全过程数据服务,为用户提供大数据云平台建设服务。
最新评论