統(tǒng)計學(xué)上采用回歸分析(regression analysis)研究呈因果關(guān)系的相關(guān)變量間的關(guān)系,。表示原因的變量稱為自變量,,表示結(jié)果的變量稱為應(yīng)變量。
研究“一因一果”,,即一個自變量與一個應(yīng)變量的回歸分析稱為一元回歸分析,;
研究“多因一果”,,即多個自變量與一個應(yīng)變量的回歸分析稱為多元回歸分析。
一元回歸分析又分為直線回歸分析與曲線回歸分析兩種,;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種,。
在臨床研究的資料中,,患者的疾病影響因素往往是與多個因素相聯(lián)系的,由多個自變量的最優(yōu)組合共同來預(yù)測或估計應(yīng)變量,,比只用一個自變量進行預(yù)測或估計更有效,,更符合實際。因此多元線性回歸比一元線性回歸的實用意義更大,。
回歸分析的任務(wù)是揭示出呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,,建立它們之間的回歸方程,利用所建立的回歸方程,,由自變量(原因)來預(yù)測,、控制應(yīng)變量(結(jié)果)。
多元線性回歸的基本原理和基本計算過程與一元線性回歸相同,,但由于自變量個數(shù)多,,計算相當(dāng)麻煩,一般在實際中應(yīng)用時都要借助統(tǒng)計軟件,,例如SPSS,。
臨床研究中應(yīng)用到多元線性回歸分析的情況很多,一個變量的變化直接與另一組變量的變化有關(guān):
人的體重與身高,、胸圍,;
血壓值與年齡、性別,、勞動強度,、飲食習(xí)慣、吸煙狀況,、家族史,;
糖尿病人的血糖與胰島素、糖化血紅蛋白,、血清總膽固醇,、甘油三脂;
射頻治療儀定向治療腦腫瘤過程中,,腦皮質(zhì)的毀損半徑與輻射的溫度、照射的時間等等,。
一,、多元回歸分析數(shù)據(jù)格式
假定對n例觀察對象逐一測定了應(yīng)變量Y與m個自變量X1X2……Xm的數(shù)值。
二,、多元線性回歸方程模型
用途:解釋和預(yù)報,。
意義:由于事物間的聯(lián)系常常是多方面的,一個應(yīng)變量的變化可能受到其它多個自變量的影響,,如糖尿病人的血糖變化可能受胰島素,、糖化血紅蛋白,、血清總膽固醇、甘油三脂等多種生化指標(biāo)的影響,。
式中β0是常數(shù)項, β1β2…….βm稱為偏回歸系數(shù)(partial regression coefficient),。
βi(i=1,2,……m)的含義為在其它自變量保持不變的條件下,自變量Xi改變一個單位時應(yīng)變量Y的平均改變量。e為隨機誤差,,又稱殘差(residual),,它表示的變化中不能由自變量Xi(i=1,2,…m)解釋的部分。
建立多元性回歸模型時,,為了保證回歸模型具有優(yōu)良的解釋能力和預(yù)測效果,,應(yīng)首先注意自變量的選擇,其準(zhǔn)則是:
(1)自變量對因變量必須有顯著的影響,,并呈密切的線性相關(guān);
(2)自變量與因變量之間的線性相關(guān)必須是真實的,,而不是形式上的;
(3)自變量之彰應(yīng)具有一定的互斥性,即自變量之間的相關(guān)程度不應(yīng)高于自變量與因變量之因的相關(guān)程度;
(4)自變量應(yīng)具有完整的統(tǒng)計數(shù)據(jù),,其預(yù)測值容易確定,。
三、SPSS應(yīng)用舉例:
27名糖尿病人的血清總膽固醇,、甘油三脂,、空腹胰島素、糖化血紅蛋白,、空腹血糖的測量值列于表1,,試建立血糖與其它幾項指標(biāo)關(guān)系的多元線性回歸方程。
表1 27名糖尿病人的血糖及有關(guān)變量的測量結(jié)果
SPSS操作分析步驟如下:
1.建立數(shù)據(jù)文件:取四個自變量,,X1,,X2,X3,,X4,,分別代表總膽固醇,甘油三脂,,胰島素,,糖化血紅蛋白,一個應(yīng)變量Y,,即血糖,。
2.統(tǒng)計分析:analyze-regression-liner輸入各自變量和應(yīng)變量,按提示選擇相應(yīng)的參數(shù)。
所建立的多元線性回歸方程為:
Y=5.943+0.142X1+0.351X2-0.271X3+0.638X4
標(biāo)準(zhǔn)化回歸系數(shù)可以用來比較各個自變量Xj對Y的影響強度,,通常在有統(tǒng)計學(xué)意義的前提下,,標(biāo)準(zhǔn)化回歸系數(shù)的絕對值愈大,說明相應(yīng)自變量對Y的作用愈大,。
本例結(jié)果顯示,,對血糖影響大小的順序依次為糖化血紅蛋白,、胰島素、甘油三脂和總膽固醇,。
(劉輝)
|