平均薪资的陷阱与真相算数平均数与加权平均数(社会平均工资合理吗?关于数据集中的问题)

集中趋势

平均薪资

在统计学中,集中趋势是一组数据的描述性总结。通过数据集的单一值,反映了数据分布的中心。此外,它不提供关于数据集中的单个数据的信息,而只提供数据集的总结。通常,数据集的集中趋势可以使用统计中的一些度量来定义。

定义

集中趋势被描述为代表整个分布或数据集的单个值的统计度量。它的目的是对分布中的整个数据提供准确的描述。

集中趋势的量度

数据集的集中趋势可以通过均值、中值和众数这三个重要的度量指标来判断。

均值

均值代表数据集的平均值。它可以计算为数据集中所有值的总和除以数据的数量。一般来说,它被认为是算术平均值。以下是一些用于发现集中趋势的平均值的其他方法:

•几何平均数

•调和平均数

•加权平均数

可以观察到,如果数据集中所有的值都相同,那么所有的几何平均值、算术平均值和调和平均值都是相同的。如果数据存在可变性,则平均值不同。计算平均值是完全容易的。计算平均值的公式如下所示

下面的直方图表示的是对称连续数据和倾斜连续数据的平均值。

在对称数据分布中,平均值准确地位于中心。但在倾斜连续数据分布中,扩展尾部的极值将均值拉离中心。因此,建议均值可以用于对称分布。

中位数

中位数是数据集的中间值,其中数据集按升序或降序排列。当数据集包含偶数个值时,可以通过取中间两个值的平均值来找到数据集的中值。

考虑给定的数据集,观测到有奇数个数据,按降序排列——23、21、18、16、15、13、12、10、9、7、6、5和2,

这里12是中间值,它上面有6个值,下面有6个值。

现在,考虑另一个例子,有偶数个观察值,按降序排列——40、38、35、33、32、30、29、27、26、24、23、22、19和17

当您查看给定的数据集时,获得的两个中间值是27和29。

现在求这两个数的均值。

例如,(27 + 29)/ 2 = 28

因此,给定数据分布的中位数是28。

众数

众数表示数据集中经常出现的值。有时数据集可能包含多个众数,在某些情况下,它根本不包含任何众数。

考虑给定数据集5、4、2、3、2、1、5、4、5

因为众数代表最常见的值。因此,给定数据集中重复频率最高的值是5。

•如果你有一个对称分布的连续数据,所有的三个度量指标的集中趋势保持良好。但大多数时候,分析师使用平均值,因为它涉及分布或数据集中的所有值。

•如果你有偏态不对称的分布,找到集中趋势的最好方法是中位数。

•如果你有原始数据,那么中值和众数都是测量集中趋势的最佳选择。

•如果你有分类数据,众数是找到集中趋势的最佳选择

通过以上的分析,在考虑数据的集中趋势时,不能完全用均值。比如全社会的平均工资可能很高,因为被高收入的人数值扭曲拉高,这个时候应该考虑中位数或众数才能反映大众的工资水平。这样低收入人群的工资就不会被“平均”。

您可以还会对下面的文章感兴趣

使用微信扫描二维码后

点击右上角发送给好友