Likelihood 區間的信心水準
與方便的同時,純 likelihood 推論有一嚴重的弱點: 它沒有一個外在確定方式來證明切點 c 有理。因為這選出的 c 並沒有參考到任何可以觀察的東西。
一般校準問題與此 likelihood 關連: 一 5% likelihood 沒有一個嚴格的意義(它依賴參數空間的大小)。 相較而言,一個 5% 機率作為一個長期頻率通常是有意義。所以,一種調整 likelihood 的方式是藉由機率。
這是在統計上傳統 likelihood-based 推論。 Fisher 宣稱無論何時只要可能我們應該使用機率 probability-based 推論; 這邊他將有準確信賴區間可獲得的情況與大樣本的情況納入。傳統(頻率學者)的對未知參數 theta 的推論靠的是估計值 theta-hat 的分布理論。
在一般情況下,大樣本理論是必須的。但它在 normal mean 模型下是簡單的。也就是當有 log(L(theta)/L(theta-hat)) ,此時如果 theta-hat 的估計式為 normal 則我們就較容易求得log(L(theta)/L(theta-hat)) 確切的分布。
例如,在 normal mean 模型下, Wilk's likelihood radio = 2log(L(theta-hat)/L(theta)) 就是一個確切的 chi-squared 分布。有確切的分布,我們就可以求取其大於某一切點 c 的機率。這是一個用來校準 likelihood 的關鍵分布理論。對一個未知但為固定的 theta 而言,它的 likelihood 區間 {theta| L(theta)/L(theta-hat) > c} 包含此 theta 的機率就是:
Prob( L(theta)/L(theta-hat) > c) = Prob( 2log(L(theta-hat)/L(theta)) < -2log(c))
= Prob(Chi-squared < -2 log(c))
因此,我們就可以根據上述,類似信心水準 alpha 選定後,對應的切點 c 值的 likelihood 區間即可產生。上述情形,確切的分布可以對應確切的切點,我們就有確切對應的信賴區間。所以,對於合理 regular 的問題,此信賴區間的解釋就趨近是真的了。
From: All In Likelihood: Statistical Modeling and Interference
留言
張貼留言