體外診斷試劑臨床試驗技術指導原則定性檢測的樣本量估算解析
來源: 致眾醫療器械資訊 2022年12月16日 11:44

體外診斷試劑臨床試驗技術指導原則定性檢測的樣本量估算解析

前言

國家藥品監督管理局發布的《體外診斷試劑臨床試驗技術指導原則》(2021年第72號通告)(下文簡述指導原則)中,給出了有確定的臨床可接受標準和不設定臨床可接受標準的兩種情況下估算樣本量的方法和公式,為體外診斷試劑臨床試驗計算樣本量提供了依據,成為臨床試驗方案設計與統計學考量的重要因素之一。但是目前一般是直接使用公式,對公式建立的依據缺乏了解,為了加強對上述公式底層邏輯的了解,做到知其然,也知其所以然,更好地利用公式,下面對這兩種情況下的估算公式的建立依據和推導過程進行解析。
對于定性體外診斷試劑的臨床試驗,從統計學的角度出發,根據伯努利大數定律

樣本量越趨近于無窮大越能越能真實反應試劑的性能,同時可以減少范Ⅰ類錯誤α(消費者風險)或Ⅱ類錯誤β(研究者風險)的風險。但是實際臨床試驗過程中出于成本和時間等因素的考慮,企業不希望也不可能做到無窮大的樣本量。因此,一般情況下,制造商在進行臨床試驗設計時為滿足試劑的臨床性能的要求,通過統計分析確定一定樣本量和檢測結果數學期望的效應值可以滿足Ⅰ類錯誤概率α或Ⅱ類錯誤概率β的設定即可。

有臨床可接受標準的樣本量估算

指導原則中第1個舉例是需證明產品評價指標滿足評價指標預期值且優于臨床可接受標準要求情況下的最低樣本量估算方法,公式為

公式中,n為樣本量;Z1-α/2、Z1-β為顯著性水平和把握度的標準正態分布的分數位,P0為評價指標的臨床可接受標準,PT為試驗體外診斷試劑評價指標預期值。

這里的邏輯需要解釋一下,如下圖所示,Ⅱ類錯誤β是指原假設H0為假但被接受的概率,即假陰性,也就是說存在Ⅱ類錯誤時就不存在犯Ⅰ類錯誤的說法。但為了根據檢驗效能(1-β)計算樣本量就需要得到H0的拒絕域,即下圖中橙色面積,所以我們雖然預期H0不成立但只能先假設H0成立。在例1中,Ⅱ類錯誤是指產品效應值符合評價指標預期值,卻僅僅認為效應值滿足臨床可接受標準,即圖中藍色面積。根據給定的Ⅱ類錯誤概率β計算的檢驗效能1-β即圖中藍色斜線部分的面積,此例中檢驗效能的意義是臨床可接受標準為假而拒絕臨床可接受標準,從而選擇評價指標預期值的概率。了解計算思路后我們開始進行最低樣本量計算公式的推導。

此時計算所得n值是在取Z1-α/2、Z1-β的臨界狀態下的樣本量,因為顯著性水平和把握度均會隨著樣本量的增加而增大,因此臨床試驗的樣本量應不低于n值且應盡量增加以更真實反應試劑性能。

沒有臨床可接受標準的樣本量估算

指導原則中第2個舉例是只保證評價指標滿足期望精度水平(置信區間的寬度一定),而不設定臨床可接受標準的情況下最低樣本量的計算方法,公式為


這里需要注意的是,因為⑥式中固定了Δ和顯著水平1-α/2,因此估算的是最大的樣本量,而不是最少的。當⑥式中的取最大值時,顯著水平1-α/2下不拒絕H0的風險最高,或者說試驗結果最可信。這里理解起來有些混淆,舉個例子,我們的檢測試劑靈敏度的期望是80%,如果我們只試驗4次,靈敏度是75%,那我們會繼續做更多的試驗去進行驗證;而如果我們試驗了4000次,靈敏度是75%,直觀上我們會更容易相信試劑的靈敏度確實達不到期望。
實際上,效應值、檢驗水準(即α)和樣本量三者是緊密相連的,其中之一發生變化,如果保持另一個不變,則第三個變量必定變化,從⑥式中也可以體現。臨床試驗過程中,我們往往是設置一個檢驗水準,再根據效應值和樣本量去計算P值(假設檢驗統計量)并與檢驗水準進行比較,來檢驗效應值是否滿足評價指標預期值。當臨床試驗樣本量增加同時檢驗水準不變時,就需要效應值更接近評價指標預期值,即Δ更小。所以⑥式只是設定Δ情況下的樣本估算量,只是一個參考值。如果實際臨床試驗時Δ小于設定值時,那么計算的樣本量不是試驗結果最可信情況;當Δ大于設定值時,可能會出現拒絕H0的情況。
總之,指導原則中給出的估算公式是最低樣本量的參考量,在此基礎上應以臨床性能得到充分評價為目標,盡可能的增加臨床試驗的樣本量。

本文著作權屬原創者所有,不代表本站立場。我們轉載此文出于傳播更多資訊之目的,如涉著作權事宜請聯系刪除。