前言:本站為你精心整理了ROC曲線的應(yīng)用措施范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
評價診斷試驗有效性的常用指標為靈敏度Se和特異度Sp[4],但評價中尚存在下列問題:對數(shù)值變量或有序分類變量,當診斷界值發(fā)生變化時,靈敏度和特異度分別朝著不同的方向變化,因此單純用某一點上的靈敏度和特異度指標比較和評價幾種診斷系統(tǒng)的診斷效能是不全面的;當一種方法的靈敏度高而另一種方法的特異度高時,則很難對兩者進行比較;傳統(tǒng)的靈敏度和特異度指標比較,未考慮醫(yī)師的診斷水平、置信水平和臨界值的選取等混雜因子的存在。因此,只有對不同的診斷界值下的靈敏度—特異度曲線進行全面的比較,才能比較客觀地反映診斷系統(tǒng)的效能。ROC曲線分析的本質(zhì)就是動態(tài)分析、比較不同診斷試驗在多個診斷界值條件下,對應(yīng)的靈敏度-特異度曲線的差異[5]。對于非二分類的診斷結(jié)果Y,我們通過選擇臨界值C(又稱截割點cut-offpoint)進行二分類,定義Y≥C為陽性結(jié)果。ROC曲線即是在所有可能的臨界值范圍內(nèi)運用該原理,將真陽率和假陽率(1-真陰率)聯(lián)系起來的一種線圖。ROC曲線下的面積表示診斷系統(tǒng)中陽性和陰性診斷結(jié)果分布的重疊程度,反映了診斷試驗價值的大小。面積越凸說明診斷價值越高,因此,可以通過比較曲線下面積的大小評價多個診斷試驗。同時,根據(jù)曲線拐點,可選取理論上最合適的截割點[6,7],使試驗的靈敏度和特異度達到最優(yōu)。另外,ROC曲線分析還可評價判別模型診斷效果[8]。從1982年Swets和Pickett將ROC分析應(yīng)用于診斷試驗到現(xiàn)在,該方法已成為生物醫(yī)學中描述診斷試驗準確性的最流行的一種技術(shù)。
2ROC曲線分析方法
2.1ROC曲線下的面積計算
2.1.1參數(shù)法Bamber[9]于1975年提出以不等邊四邊形理論(trapezoidalrule)為基礎(chǔ)的ROC曲線下面積計算公式:A=k-1∑j=1P(T=j|D=0)k∑i=j+1P(T=l|D=1)+12k∑k=1P(T=k|D=0)P(T=k|D=1)。國內(nèi)有人提出用累積比數(shù)模型[10],將真實病情(參照金標準)D看作解釋變量,待評估的診斷試驗作為反應(yīng)變量,用于小樣本的ROC曲線下面積計算。
2.1.2非參數(shù)法包括Wilcoxon統(tǒng)計量思想(HanleyJA,1982年),Mann-Whitney和Kolmogorov-Smirnov統(tǒng)計量[11]。Hanley[3]于1982年提出在資料分布未知的情況下ROC曲線下面積的計算方法,引用了非參數(shù)檢驗方法中Wilcoxon統(tǒng)計量的思想,將各截割點看作可依次排序的秩項,列出計算表,估計曲線下的面積及其標準誤,W=1nA•nNnA∑1nN∑1S(xA,xN)。最近又相繼有人提出了在確診偏性存在條件下[12]和有重復測量數(shù)據(jù)[13]的ROC曲線面積的非參數(shù)估計方法。
2.2面積的可信區(qū)間計算
對于ROC可信區(qū)間的研究,Hilgers等提出所謂“自由分布”可信區(qū)間,Campbell[11]介紹了3種整條ROC曲線可信區(qū)間的計算方法,以Kolmogorov-Smirnov統(tǒng)計量或者Bootstrap再抽樣為基礎(chǔ)的“球形”可信帶,但都存在可信區(qū)間相當寬的問題。Jensen等[14]于2000年提出可以只計算研究者感興趣的“局部”可信帶,使得原本很寬的可信帶變窄,這樣ROC曲線的應(yīng)用更有實際意義。
2.3ROC曲線下面積比較
ROC曲線下面積比較的方法較多,以正態(tài)分布的U檢驗為主。這些方法都要求有確診病例[15],然而只用確診病例資料作分析會帶來確診偏性,Zhou[16]在隨機缺失(missing-at-random,MAR)假設(shè)基礎(chǔ)上提出一種確診偏性校正方法用于ROC曲線下面積的比較,分別在有、無協(xié)變量情況下作臨床資料分析??梢杂肕L法估計參數(shù),Delta法求出面積估計值的協(xié)方差陣,作面積比較的假設(shè)檢驗。Delong等[17]則提出一種用于比較兩個或多個相關(guān)ROC曲線下面積的非參數(shù)方法。
2.4ROC的回歸分析
ROC的回歸模型分析方法在許多生物醫(yī)學研究中被當作一種有用的方法,但在診斷試驗中的應(yīng)用和發(fā)展卻較緩慢。Tosteson等[18]將有序回歸模型用于診斷試驗的評價;Smith[19]提出了連續(xù)比模型的ROC分析;Wendy等[20]在1997年提出用邊際二分類回歸法對診斷試驗進行分析。Margaret[21]于1998年在前人的基礎(chǔ)上,提出了3種不同的ROC回歸方法,結(jié)合連續(xù)型的臨床資料對這3種方法加以比較發(fā)現(xiàn):方法1(ModelingtheTestResult)在評價協(xié)變量對ROC曲線作用大小時最敏感,不能用于診斷方法間的比較;方法2(ModelingSummaryMeasuresofAccuracy)要求協(xié)變量是離散的,對連續(xù)型協(xié)變量不適用,與其他兩方法相比適用范圍窄,但卻是最簡單的輔助方法,并有相關(guān)軟件可用。
3LROC法
傳統(tǒng)的ROC方法解決的是患病與否、病灶存在與否、良性或惡性等二分類問題,常用于病灶位置明確或可以忽略病灶位置的情況。實際應(yīng)用中,往往要考慮正確定位的問題,這時對傳統(tǒng)ROC曲線改良,以定位正確的真陽性率為縱坐標,以假陽性率為橫坐標,就得到LROC曲線。Starr等在1975年提出將每幅影像劃分為m個鄰近等分的子區(qū)域[22],最典型的為4分法,要求放射醫(yī)師同時指出病變的可信水平和最可能出現(xiàn)的部位,然后作ROC分析。他介紹了如何由已知的ROC曲線來有效預(yù)測相應(yīng)的LROC曲線。Richard[23]于1996年提出更為普遍的LROC模型,采用極大似然估計法,對診斷試驗的測定和定位準確性進行評價,并將新方法與標準的等級資料的ROC分析作比較。在等級資料的LROC模型基礎(chǔ)上,該作者衍生出相應(yīng)的free-responseROC(FROC)模型,這樣使得單個病灶和多個病灶的影像測定和預(yù)測任務(wù)有了一致的統(tǒng)計方法。
4FROC法
當臨床上要求對每幅影像存在多個病灶進行定性、定量、定位診斷時,需要應(yīng)用FROC方法。FROC曲線是以定位正確的真陽性率為縱坐標,以所有影像平均的假陽性病灶數(shù)為橫坐標的一種ROC曲線。Metz等曾假定每幅影像上的病灶數(shù)為n(通常n=2),通過建立一個n(n+1)維的多維空間來做評價。該方法僅在理論上有效,尚未在臨床放射學中實踐,也無相關(guān)統(tǒng)計軟件可用。1978年Bunch等認為FROC法在影像學中具有比ROC法更簡單更利于構(gòu)建統(tǒng)計量的優(yōu)點。Chakraborty等[22]給出了一種用于FROC資料分析的模型,這是類似用于ROC資料分析的雙正態(tài)模型,但比它更為一般的兩參數(shù)模型。用極大似然法作參數(shù)估計,提供了參數(shù)方差估算的表達式,并由單個診斷者得到的FROC曲線綜合之后推出平均FROC曲線,但此推導尚有爭議。對于free-responsedata的分析,Chakraborty[24]還提出更為一般的兩種方法:(1)TheAl-ternativeFROC分析法(AFROC法),即對FROC影像以另一種記分的方法統(tǒng)計;(2)Free-responseforcederrorexperiment(FFE法)。作者還聯(lián)立這3種方法(FROC-AFROC-FFE)對同樣幾批影像資料進行分析比較,發(fā)現(xiàn)這3種方法對free-response資料的分析評價效果基本一致。
5SROC法
在ROC曲線方法的基礎(chǔ)上,Lincoln等[25]于1993年提出用SummaryROC方法將一個診斷試驗的多個相互獨立的研究結(jié)果綜合之后進行分析,該方法要求將頻數(shù)資料轉(zhuǎn)換為頻率資料的形式。SROC法的基本步驟如下:先分別對真陽率和假陽率進行Logistic轉(zhuǎn)換,依次定義為U和V,用頻數(shù)四格表中的a、b、c、d進行估計,當某個格子為0時須校正;對U和V的估計值分別相減、相加得到D和S的估計值;用最小二乘法以(Si,Di)擬合直線方程^D=A+B•^S;最后將直線映象到ROC空間,便得到SROC曲線。Moses建議在綜合評價多個診斷試驗時,去除那些靈敏度和特異度均小于0.5的診斷試驗,即以Se為縱坐標,1-Sp為橫坐標作圖,只取落在左上角區(qū)域外的點。Irwig[26]認為此建議不妥,因為:(1)左上角區(qū)域的選取是人為制定的,并非從臨床相關(guān)角度出發(fā);(2)被剔除的診斷試驗可能是由于樣本的變異較大造成靈敏度和特異度的下降;(3)診斷截割點的改變可能導致試驗點在圖形上的漂移。SROC作為對同一診斷試驗多個獨立研究結(jié)果的綜合,可計算得到較穩(wěn)定的OR值和診斷試驗評價的指標。
6GROC法
Francois[27]于1991年提出GROC分析(GeneralizedROCAnalysis)的概念,將傳統(tǒng)的ROC曲線和臨界值方法用于醫(yī)學決策問題。將常規(guī)的診斷試驗準確性評價資料和其他醫(yī)學問題聯(lián)系起來,包括風險、成本、實用性以及疾病的先念概率等,可以解決多種診斷試驗、多個靈敏度和特異度的復雜情況,因此可以考慮不同質(zhì)的總體,即發(fā)病概率不同的人群資料的診斷試驗評價問題。用到一種比ROC曲線下面積更好的指標,綜合考慮病人的結(jié)局風險、技術(shù)成本及疾病的先念概率。該指標可用于比較已有的診斷技術(shù),也可評價新的前瞻性研究方法。以上診斷試驗評價的方法多數(shù)都是基于金標準存在的情況適用,在實踐中常常因應(yīng)用金標準的費用過高,或?qū)嵤┙饦藴室袆?chuàng)傷性檢查而不被接受。針對這種無法獲得金標準確診的情況,Joseph等[28]提出用Bayesian方法估計診斷試驗的p、Se和Sp,具有廣闊前景,而且錯分資料的問題[29]也可迎刃而解,但無金標準條件下的ROC曲線方法還未見報道。