如需评估测量中(zhōng)的误差范围,您可(kě)使用(yòng)基本的统计學(xué)方法计算标准偏差,正如我们在这里已讨论过的那样。但即使是对于整个群體(tǐ)中(zhōng)的一个样本,其估计的标准偏差仍然需要相对大量的测量。在光谱學(xué)中(zhōng),我们通常对一个样本进行几次测量,可(kě)能(néng)是5到10次。在该抽样准则中(zhōng),使用(yòng)正态分(fēn)布标准偏差的基本表达式无法得出测量误差的可(kě)靠值。幸运的是,20世纪初在啤酒生产(chǎn)方面所做的工(gōng)作(zuò)给了我们一个解决方案。
William Sealy Gosset,Wikipedia.org
William Sealy Gosset和健力士
William Sealy Gosset是一名(míng)统计學(xué)家,其在都柏林的健力士啤酒厂担任首席啤酒酿造师。他(tā)关心的是从各种大麦(啤酒的重要原料)中(zhōng)获得极好产(chǎn)量。当他(tā)不得不从少到三粒大麦中(zhōng)得出有(yǒu)意义的统计學(xué)结论时,他(tā)在工(gōng)作(zuò)中(zhōng)遇到小(xiǎo)样本量问题。
在1908年发表的论文(wén)《平均数的概率误差》中(zhōng),他(tā)这样描述了这个问题:
“随着实验次数的减少,从实验样本中(zhōng)发现的标准偏差的值本身会受到越来越大的误差影响,直到以这种方式得出的判断可(kě)能(néng)会完全产(chǎn)生误导。”
Gosset开发了后来被称為(wèi)“學(xué)生t-分(fēn)布函数”的方法(之所以这样命名(míng),是因為(wèi)他(tā)以筆(bǐ)名(míng)“學(xué)生”发表了这篇论文(wén)),并且公(gōng)布了可(kě)用(yòng)于极小(xiǎo)样本量的数值表。该分(fēn)布比正态分(fēn)布更宽、更短,并允许更多(duō)的偏离测量值。随着测量次数的增加,分(fēn)布情况趋向于呈现经典的正态分(fēn)布曲線(xiàn)。
t-分(fēn)布函数
t-分(fēn)布函数给出的置信區(qū)间表达式為(wèi):
uc=x̅+/-Tx
式中(zhōng):
x̅:测量值的平均值
TX:t-分(fēn)布函数的值。根据以下公(gōng)式计算:
Tx=(t(f,P)x s/N1/2
式中(zhōng):
t:取自公(gōng)布表格的值,该值取决于f(测量的样本数-1)和P(期望的置信度)。
s:测量系列的标准偏差
N:采用(yòng)的测量次数
在光谱學(xué)中(zhōng)使用(yòng)t-分(fēn)布函数
让我们以一个组件中(zhōng)铬的真实成分(fēn)结果為(wèi)例,描述使用(yòng)t-分(fēn)布函数计算置信區(qū)间的过程。
10次读数的平均值:18.54%
标准差:0.1%。
我们将选择95%置信度,因此必须使用(yòng)的数字是:
N:10(10次读数)
s:0.1%(标准偏差取自上表)
t:2.262(针对置信區(qū)间為(wèi)95%和样本量為(wèi)10,取自公(gōng)布的表格,f=n-1)
因此:
Tx=(2·262 × 0·1%)/3·162=0·072%
我们可(kě)用(yòng)其作(zuò)為(wèi)我们的置信區(qū)间:
uc=x+/- Tx
x:18.54(测量结果的平均值,取自上表)
uc(95.9)=18.54%+/- 0.07%
这表明我们有(yǒu)约95%的置信度,认為(wèi)铬的真实值介于18.47%到18.61%之间。
有(yǒu)趣的是,t-分(fēn)布函数给出一个小(xiǎo)于标准偏差的置信區(qū)间,这意味着我们的光谱學(xué)测量实际上比标准统计學(xué)方法所显示的结果更精(jīng)确。
当然,如需使用(yòng)这种方法,您必须在光谱仪中(zhōng)读取单个样本的多(duō)个读数。