把整体集合汇成一个数字,让它来代表整体,我们把这「一个数字」称之为「代表值」。其中最常见的一种,就是我们所说的「平均数」,也就是 Excel 函数中的「 AVERAGE 」。但是,这个方法也蕴含着几个陷阱。
计算平均数的方法有「简单算术平均」和「加权平均」两种。
举个例子。在计算学校班级中男生的平均身高时,我们不会说「把哪种男孩作为重点,来计算平均值」。因此,我们会把全部班级的男生身高合计出来,除以男生总人数,就能算出「算术平均值」。在这样的情况下这个算法没有任何问题。
但是下面这种情况应该怎么办呢?为了评估 3 种拉面,我们邀请主妇、单身男性、美食评论家、美食报道记者、其他拉面店的店主这 5 人,让每人以满分 10 分的标准对拉面进行打分,根据平均值来决定胜负。这种情况如果使用「简单算术平均」的话,就表示单身男性、美食报道记者、主妇以及拉面店店主的评估具有同样的分量了。
但考虑到「 5 个人对于拉面的了解程度」这一点,我们在这里应该使用「加权平均法」。比如说,美食评论家的分数是乘1,主妇是乘 0.5 ,单身男性是 0.8 ,通过这样来改变分数的比重进行计算平均值。
当我们不知道该用「简单算术平均」还是「加权平均」时,我们就要回归到「分析目的=想追求的是什么」上去,就能得到答案了。
除了「平均数」,我们把所有的数字按从上到下的顺序排列,其中,这组数据中间位置的数就是「中位数」了。采取平均数还是中位数的计算方法会对分析结果有很大的影响,因此,我们需要区分二者的差异。
例如,在对日本 8000 个户主达到 20 岁以上且家庭成员有 2 名以上的家庭进行了「关于家庭生计的金融行为的舆论调查」,根据 2015 年数据的记载,这些家庭存款等金融资产的持有额平均达到 1209 万日元(约合人民币 74 万元)。
看到这个数字时,很少会有人会说「那我一定要更加努力攒钱」。因为,这个数字偏离了平常的认知。在这种情况下如果采取中位数计算方法的话,就发现金融资产的持有额就会下降到 400 万日元,即人民币 24 万元。
像这样,即使是同样的数字,是把「平均数」还是把「中位数」作为代表值,所分析出来的意义是完全不同的。
当你犹豫不定把哪个数值
(本章节未完结,点击下一页翻页继续阅读)