可能性比檢定(Likelihood ratio test)

直接使用 likelihood  來做假設檢定,例如去檢定一個 Null hypothesis: H0: theta = theta0,我們可以以報告 H0 的可能性 likelihood 作為 theta0 標準化過的可能性 likelihood :

L(theta0)/L(theta-hat)

我們能夠去 reject H0,宣告數據不支持它,假如它的可能性是太小,意味著有其它被數據有多很多支持的假設。多小才算太小就留給主觀判斷,它可依應用情況或其它可能包含先驗知識的來考量。

在法庭的許多情況,對 "被告是無辜的" 的假設,在我們可以否決它之前,可能設定它在低可能性的水準,與此同時 "經基因工程的食物沒有副作用" 的假設可以更輕而易舉的被否決。


無論如何,可能性測定的議題在這裡也是有關係的,如先說一個 5% 的可能性,這可能沒有一個固定的意義。

在正常的一個參數的問題中,可以拿到一個藉著 Wilk's statistic 的分布,基於機率測定所產生的 P-值。由之前的例子,察看到 L(theta0)/L(theta-hat) = c,P值的趨近值是

P( chi-squared > -2 log(c) 

這展示出在可能性比(likelihood ratio) 與 P-值間通常有些關係,如此 P-值用到的時機就是用它來做為支持度的量測。無論如何,因為 P-值會依賴實驗的樣本空間,故這關係會視實驗而定。雖然 P-值一直以來受到一些統計學家的批評,但它在實務上還是受到廣泛的使用,它似乎不太可能消失。

在 non-regular 的問題中,我們不知道如何去測定可能性,我們可能必須使用純可能性比(likelihood ratio)作為支持度的量測。當沒有基於機率推論的正當理由時,這個與純可能性區間(likelihood intervals)的使用一致。例如說,去檢定 theta = 0.5, 而如何去定義此檢定的一 P-值不是很清楚時。另外的例子是一般在檢定統計量的分布為非對稱的情況下: 確切兩邊的 P-值是模擬兩可,此時就可能有好幾個角逐的定義。



留言

這個網誌中的熱門文章

標準差與 Wald 統計量

Wold Decomposition Theorem