经过美世界购物中心,又遇到推介“技能创前程基金”认可的课程的人。上网查看,果然还有年底逾期作废的余额。正在踌躇选课,心血来潮,既然每天都看着与统计数值有关的各类报道,何不去参加基本统计课程,复习也乘机学习一些数据处理技巧?

打开讲义,这课程从概论、或然率、概率分布、平均值和标准差等描述统计,到抽样统计,z、t、chi假说检验、方差分析(ANOVA)、线性回归(Linear Regression)和相关性分析等等。足足130多页的幻灯演示片,要在一天半内复习几乎是大学一年级的全部课程,还要加上两个小时的测验,看来这次是自讨苦吃,选错课程了!

授课的是富有教学经验的翁伟恒博士,他花了更多时间在讲“故事”。他用许多日常传媒的新闻和报告,解释每个学术用语的定义、意义以及实际用法,而没注重如何去计算出那些数值。等到他出题要我们计算,本以为要伤脑筋套公式之际,他却逐一介绍Excel电子计算表和许多网络应用,只要输入数据,按按键盘click click两下,各种数值秒间就出现了!除非是学术考试,现在做统计连计算机都可以不用了。我们也只需要解读那些数值的含义,甚至可以进阶到用AI为我们效劳!统计学的真谛不再是复杂的公式和计算,重点是如何从收集到的原始数据,得出所要的数值,讲述数据能告诉我们的故事。如此就不得不去再好好阅读经典著作《如何用统计学说谎》(How to Lie With Statistics),才能不被传媒的数值牵着鼻子走。

由于任何问卷调查都不可能涵盖所有相关人士,只能抽样进行。抽样在统计学里是有严谨的理论和计算支撑的。抽样统计的应用本在工业产品和生产线等问题,外在条件都是可控性的,但普及化后用在人文和社会问题上,就有商榷的地方了。我们在媒体看到数值时,习惯上都默认负责调查的组织是专业且中立的;也不多注意参与调查的人数、背景,甚至是在什么地方、环境和时间下进行,更没去看问卷问题的设计等。其实有心人士在任何一个环节,都可以做点手脚,得出预期想要的数值支撑他们的论据。原始数据不会说谎,说谎的是会巧用和滥用统计学的人。

我们每天都制造或接触海量的数据,人脑要从中过滤出有用的信息,作为知识的基础,知识被消化后才成为智慧。这漫长又艰难的过程已被人工智能超越,且它正朝着人工智慧推进。人类作茧自缚,未来祸福难料呀!