资讯处   19.12.2011

389

「或然之论无他,乃付常理于推算而已。」
陈炳城教授(中)和他的研究团队
 
《中大通讯》第389期 > 洞明集 > 或此、或彼、或然

或此、或彼、或然

previouspausenext

统计学的现代应用

法国数学和天文学大师拉普拉斯(1749–1827)曾说:「人生至为莫名者,十之八九惟或然之所困惑也。」拉普拉斯是或然率论的巨擘,他在1812年出版的《或然率的解释理论》中更说:「或然之论无他,乃付常理于推算而已。」

或然率亦称「机率」,国内现通称「概率」,基本概念是指某随机事件在同一情况下可能发生或者不发生,表示发生可能性大小的量,就是或然率。以掷硬币来说,硬币掉在地上时,有一半机会是头像一面朝天,另一半机会是文字一面,两者的或然率都是二分一。或然率论是从数量角度研究或然现象规律性的一门数学分支,源自十七世纪对赌博、航海风险、测量误差等问题的研究,其后随科技的进步而迅速发展,且与其他学科互相结合,在现代科技、工业生产,以至金融及保险等经济活动上的应用非常广泛,更是数量统计学的理论基础。

或然率的理论不过是「付常理于推算」,拉普拉斯把话可说得简单。狼来了的故事就是好例子。统计学系陈炳城教授在中大迎新营中,便以这个故事向学生解释统计学的道理。当牧羊童第一次喊「狼来了」,村民在常理上都相信的;第二次喊「狼来了」,常理上仍不虞有诈,每一次喊「狼来了」,牧羊童在说谎的或然率就是村民的参考数据。到收集了足够的数据,村民的决定会改变,常理上不会再相信「狼来了」这鬼话了。陈教授说:「这个故事是典型的统计应用。」

陈教授最有兴趣研究的是统计学里的删失数据,即是在进行统计时,存在于收集范围以外的不明数据。「例如我们要量度一班六年级学生的身高,但量度用的尺只有一百五十厘米长。结果一班三十人,有二十五个可以量度到真正的高度,余下五人只知道高于一米半。这五个同学的身高就是删失数据。」

所有数据都会出现删失的问题,较严重的便成为遗失数据,最明显的例子是一份问卷十条问题只答了八条,或者设计问卷时失误,应问的没有问。不过统计学家不会放弃删失或遗失数据,他们会利用不同的数学模型,把不明显的数据和所有收集得来的数据一并估算,以取得较完整和准确的统计资料。「最常用的方法是利用条件或然率,把删失或遗失的数据推断出来,输入作估算,然后与不输入这些数据的估算结果比较。两者若相差不远,推断的数据便算有效。」

删失数据主要应用在计算工业产品的可靠及耐用程度,小至普通家庭用品如家具及电器,大如汽车、飞机,以至核电厂,都利用删失数据估算寿命分布,即是在不同情况下的表现和可以使用多久。这也是陈教授现时专注的研究范围。他解释说,要收集足够数据来评估产品在正常情况下的寿命并不容易,现时业界普遍采用「加速寿命试验」进行测试,把物件置于极大应力下加速其损坏,然后利用所得数据,推算产品应有的寿命。那些在测试时间内仍幸存的物件,称为删失观测数据。

陈教授的研究,就是从利用测试实验数据进行最可能统计推断,找出不同物件按不同标准应接受的最有效应力测试,以助业界设计出省时、准确和符合经济效益的测试实验。「新产品推出市场的时间由此可以缩短,」他说。「不过产品应如何设计才算是可靠和耐用,有时候是商业决定,我们只提供科学数据作参考。」

各期刊物

最新10期

2020年代

2010年代

2019–20

2018–19

2017–18

2016–17

2015–16

2014–15

2013–14

2012–13

2011–12

2010–11

2000年代

2009–10

2008–09

2007–08

2006–07

2005–06

2004–05

2003–04

2002–03

2001–02

2000–01

1990年代

1999–2000

1998–99

1997–98

1996–97

1995–96

1994–95

1993–94

1992–93

1991–92

1990–91

1980年代

社交网路书签

twitter   facebook   谷歌   百度   qq

快速连结