何時我們使用 likelihold 區間?

何時我們使用純 likelihold 區間?

一個 likelihood 區間表示一個符合或被數據所支持的參數值集合。在給定模型情況下,一個 likelihood 區間是一種客觀的區間,在這種意義下,它沒有涉及任何主觀先驗的選取。無論如何,Fisher 是清楚 likelihood 本身只是提供一種相較於 probability-based 而言較弱推論形式。不像信賴區間,一個純 likelihood 區間沒有一種由重複抽樣而來的解釋 - 默默參照到就像實驗大量的被反覆所產生的長期的性質。這些長期性質提供 probability-based 區間一種(潛在)外在的有效度可以推廣普遍的範圍。

像是 likelihood-based 區間這種命名可能令人混淆,因為純 likelihood 區間與傳統 likelihood-based 信賴區間都是由相同的 likelihood function 所衍生出來。事實上,數值上來說它們是相同的。而我們現在這邊討論的是與這個區間有關聯的不確定性。傳統上,獲得它只能藉著機率(或信賴水準)。但由 Fisher支持圈的觀點這也可以藉由 likelihood 給報告出來。

從此以往,一個 likelihood-based 的區間,如果有一個理論上合理的信心水準, 則叫它信賴區間; 否則就叫它 likelihood 區間。大家都知道一般一個信心水準實際上不是針對一個實際的觀察區間,因為它只有在長遠的觀點看才會有意義。

假如我們將一個區間想成是 theta 在哪裡的猜測,一個 95% 正確的機率不能套在某一個各別特別的猜測。 (相比之下,由 likelihood 所提供的不確定的意義之下,它只套用在某一個各別特別的猜測。)

下面是改編自 Berger & Wolpert (1988) 的例子。

某一個人選一個固定的整數,要求你猜這個數基於下面這些數據:

他將投一枚硬幣兩次(但你看不到所投的結果),同時在每次投幣時,如果是正面他會報 theta + 1;否則他報 theta -1。 因此,數據 X1 與 X2 是 iid 由在 theta+1 與 theta -1 都有相同為 0.5 的機率分布來的樣本。例如,他可能報 X1=5 與 X2 =5。

下面的猜測將有 75% 是正確機率:

                     (X1 + X2)/2 , 當 X1 != X2
C( X1,X2) =
                      X1 - 1, 當 X1 = X2

根據信心程序的邏輯,上述猜測有 75% 的信心水準。但是,假如 X1 != X2 時,我們應該有 100% 的信心,否則我們只有 50% 的信心。當我們觀察到 X1 != X2 時,如果你堅持對 (X1+X2)/2 只有 75% 的信心,這將是很荒謬。 這裡,一個純 likelihood 的方法可能與我們的常識符合: 它將對每個觀察到的 (X1,X2) 報出我們關於 theta 的不確定性。它不是說任何有關於正確長期的機率。

上面類似的統計例子,我們之後也會有更多的討論。

Fisher 他自己對用來做推論的機率使用多加了一個額外必要條件:

這樣的機率使用不應該有可能去識別樣本空間的子集,那裏我們可以做出同樣有效但不同(條件)的概率陳述。

這文章在這些可識別的子集是相當深奧難懂的,而且在目前統計務實上還沒有有任何影響。

From: All In likelihood: Statistical modeling and Inference


留言

這個網誌中的熱門文章

標準差與 Wald 統計量

可能性比檢定(Likelihood ratio test)

Wold Decomposition Theorem