典型的統計問題
在現實世界的問題中,不確定性是普遍的。但是統計是唯一科學的分支,系統性的努力去處理這些不確定性。對這些因受限於訊息而有不確定性的問題,統計是適用的: 統計目的不是去除不確定性,在許多案例中它僅僅是去量化它,在分析完成後不確定性還是不會消失。
.
範例: 阿斯匹靈數據
在一個對低劑量阿斯匹靈對健康個人預防的好處研究中,對總共有 22,071 的健康的人隨機的安置於阿斯匹靈或安慰劑組,平均追蹤 5 年。在追蹤期間心臟病或中風的數據如下:
Group Heart Strokes Total
attacks
Aspirin 139 119 11,037
Placebo 239 98 11,034
Total 378 217 22,071
主要的醫學問題是統計的: 阿斯匹靈有好處嗎? 明顯的在阿斯匹靈組有較少的心臟病 139 對 239。但是我們面對相同問題: 這證據有足夠強到我們有信心回答這問題嗎? 中風的副作用在阿斯匹靈組是較大的,雖然 119 比 98 不像它的好處那樣令人信服。
假設我們表達阿斯匹靈的好處以相對風險:
139/11037
--------------- = 0.58
239/11034
相對風險 1 代表阿斯匹靈沒有好處,而相對風險遠小於 1 代表阿斯匹靈有好處。然而 0.58 是足夠小於 1 嗎? 回答如此的問題需要一個隨機模型來描寫我們所觀察的數據。在這個範例中,我們對在阿斯匹靈組的心臟病數以 binomial(theta1) 進行建模,在安慰劑組的心臟病數以 binormial(theta2) 。因此,真正的相對風險就是 theta = theta1/theta2。
讓我們用 0.58 來表示這觀察到的相對風險。這數字沒有不確定性,所以不能用它來回答原來問題中的統計本質。是否這實驗包含這樣的訊息 - theta 是遠小於 1?
現在我們假設這個研究實驗擴大 10 倍,所以也假設有相同的事件比例,也就是我們觀察到 1390 比 2390 的心臟病。然後相對風險 theta 還是 0.58。 但直覺上,訊息現在應該比較強了吧。
所以,也必需包含一些對 theta 精準度的量測數據,由此我們可用來評估遠離 1 的信心。
如此,現在接下來我們可以陳述統計推論的基本問題: 如何由觀測數據到對我們有興趣參數進行陳述呢?
From: In All Likelihood: Statistical Modelling and Inference Using Likelihood
.
範例: 阿斯匹靈數據
在一個對低劑量阿斯匹靈對健康個人預防的好處研究中,對總共有 22,071 的健康的人隨機的安置於阿斯匹靈或安慰劑組,平均追蹤 5 年。在追蹤期間心臟病或中風的數據如下:
Group Heart Strokes Total
attacks
Aspirin 139 119 11,037
Placebo 239 98 11,034
Total 378 217 22,071
主要的醫學問題是統計的: 阿斯匹靈有好處嗎? 明顯的在阿斯匹靈組有較少的心臟病 139 對 239。但是我們面對相同問題: 這證據有足夠強到我們有信心回答這問題嗎? 中風的副作用在阿斯匹靈組是較大的,雖然 119 比 98 不像它的好處那樣令人信服。
假設我們表達阿斯匹靈的好處以相對風險:
139/11037
--------------- = 0.58
239/11034
相對風險 1 代表阿斯匹靈沒有好處,而相對風險遠小於 1 代表阿斯匹靈有好處。然而 0.58 是足夠小於 1 嗎? 回答如此的問題需要一個隨機模型來描寫我們所觀察的數據。在這個範例中,我們對在阿斯匹靈組的心臟病數以 binomial(theta1) 進行建模,在安慰劑組的心臟病數以 binormial(theta2) 。因此,真正的相對風險就是 theta = theta1/theta2。
讓我們用 0.58 來表示這觀察到的相對風險。這數字沒有不確定性,所以不能用它來回答原來問題中的統計本質。是否這實驗包含這樣的訊息 - theta 是遠小於 1?
現在我們假設這個研究實驗擴大 10 倍,所以也假設有相同的事件比例,也就是我們觀察到 1390 比 2390 的心臟病。然後相對風險 theta 還是 0.58。 但直覺上,訊息現在應該比較強了吧。
所以,也必需包含一些對 theta 精準度的量測數據,由此我們可用來評估遠離 1 的信心。
如此,現在接下來我們可以陳述統計推論的基本問題: 如何由觀測數據到對我們有興趣參數進行陳述呢?
From: In All Likelihood: Statistical Modelling and Inference Using Likelihood
留言
張貼留言