統(tǒng)計(jì)學(xué)上采用回歸分析(regression analysis)研究呈因果關(guān)系的相關(guān)變量間的關(guān)系,。表示原因的變量稱為自變量,,表示結(jié)果的變量稱為應(yīng)變量。
研究“一因一果”,,即一個(gè)自變量與一個(gè)應(yīng)變量的回歸分析稱為一元回歸分析,;
研究“多因一果”,,即多個(gè)自變量與一個(gè)應(yīng)變量的回歸分析稱為多元回歸分析。
一元回歸分析又分為直線回歸分析與曲線回歸分析兩種,;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種,。
在臨床研究的資料中,患者的疾病影響因素往往是與多個(gè)因素相聯(lián)系的,,由多個(gè)自變量的最優(yōu)組合共同來(lái)預(yù)測(cè)或估計(jì)應(yīng)變量,,比只用一個(gè)自變量進(jìn)行預(yù)測(cè)或估計(jì)更有效,更符合實(shí)際,。因此多元線性回歸比一元線性回歸的實(shí)用意義更大,。
回歸分析的任務(wù)是揭示出呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,建立它們之間的回歸方程,,利用所建立的回歸方程,,由自變量(原因)來(lái)預(yù)測(cè)、控制應(yīng)變量(結(jié)果),。
多元線性回歸的基本原理和基本計(jì)算過程與一元線性回歸相同,,但由于自變量個(gè)數(shù)多,計(jì)算相當(dāng)麻煩,,一般在實(shí)際中應(yīng)用時(shí)都要借助統(tǒng)計(jì)軟件,,例如SPSS。
臨床研究中應(yīng)用到多元線性回歸分析的情況很多,,一個(gè)變量的變化直接與另一組變量的變化有關(guān):
人的體重與身高,、胸圍;
血壓值與年齡,、性別,、勞動(dòng)強(qiáng)度、飲食習(xí)慣,、吸煙狀況,、家族史;
糖尿病人的血糖與胰島素,、糖化血紅蛋白,、血清總膽固醇、甘油三脂,;
射頻治療儀定向治療腦腫瘤過程中,,腦皮質(zhì)的毀損半徑與輻射的溫度、照射的時(shí)間等等,。
一,、多元回歸分析數(shù)據(jù)格式
假定對(duì)n例觀察對(duì)象逐一測(cè)定了應(yīng)變量Y與m個(gè)自變量X1X2……Xm的數(shù)值。
二、多元線性回歸方程模型
用途:解釋和預(yù)報(bào),。
意義:由于事物間的聯(lián)系常常是多方面的,,一個(gè)應(yīng)變量的變化可能受到其它多個(gè)自變量的影響,如糖尿病人的血糖變化可能受胰島素,、糖化血紅蛋白,、血清總膽固醇、甘油三脂等多種生化指標(biāo)的影響,。
式中β0是常數(shù)項(xiàng), β1β2…….βm稱為偏回歸系數(shù)(partial regression coefficient),。
βi(i=1,2,……m)的含義為在其它自變量保持不變的條件下,自變量Xi改變一個(gè)單位時(shí)應(yīng)變量Y的平均改變量,。e為隨機(jī)誤差,,又稱殘差(residual),它表示的變化中不能由自變量Xi(i=1,2,…m)解釋的部分,。
建立多元性回歸模型時(shí),,為了保證回歸模型具有優(yōu)良的解釋能力和預(yù)測(cè)效果,應(yīng)首先注意自變量的選擇,,其準(zhǔn)則是:
(1)自變量對(duì)因變量必須有顯著的影響,,并呈密切的線性相關(guān);
(2)自變量與因變量之間的線性相關(guān)必須是真實(shí)的,而不是形式上的;
(3)自變量之彰應(yīng)具有一定的互斥性,,即自變量之間的相關(guān)程度不應(yīng)高于自變量與因變量之因的相關(guān)程度;
(4)自變量應(yīng)具有完整的統(tǒng)計(jì)數(shù)據(jù),,其預(yù)測(cè)值容易確定。
三,、SPSS應(yīng)用舉例:
27名糖尿病人的血清總膽固醇,、甘油三脂、空腹胰島素,、糖化血紅蛋白,、空腹血糖的測(cè)量值列于表1,試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線性回歸方程,。
表1 27名糖尿病人的血糖及有關(guān)變量的測(cè)量結(jié)果
SPSS操作分析步驟如下:
1.建立數(shù)據(jù)文件:取四個(gè)自變量,,X1,X2,,X3,,X4,分別代表總膽固醇,,甘油三脂,,胰島素,糖化血紅蛋白,,一個(gè)應(yīng)變量Y,,即血糖。
2.統(tǒng)計(jì)分析:analyze-regression-liner輸入各自變量和應(yīng)變量,按提示選擇相應(yīng)的參數(shù)。
所建立的多元線性回歸方程為:
Y=5.943+0.142X1+0.351X2-0.271X3+0.638X4
標(biāo)準(zhǔn)化回歸系數(shù)可以用來(lái)比較各個(gè)自變量Xj對(duì)Y的影響強(qiáng)度,,通常在有統(tǒng)計(jì)學(xué)意義的前提下,,標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值愈大,說明相應(yīng)自變量對(duì)Y的作用愈大,。
本例結(jié)果顯示,,對(duì)血糖影響大小的順序依次為糖化血紅蛋白、胰島素,、甘油三脂和總膽固醇,。
(劉輝)
|