一種二次主成分分析模型解決病情確診的實現(xiàn)
因C1=[X1 X2 … X7]*[U11 U12 … U17]T,因為特征值的方差貢獻(xiàn)率為72.67 %,表明C1包含原變量中的絕大部分信息,則在原來7個因子的基礎(chǔ)上引入C1作為第8個因子,C1=[0.70502、0.6341、0.87415、0.80724、0.4212、0.62897、0.37992、0.85489、0.57495、0.71527、-0.74635、0.03003、-0.30047、-0.03826、-0.80605、-1.32826、-0.5588、-0.00363、0.37216、-3.19199].再將其做標(biāo)準(zhǔn)化變化,再次通過主成分分析并結(jié)合SPSS軟件確定B第一主成分F1、第二主成分F2和綜合主成分F.根據(jù)對這8個因子通過SPSS的因子分析如表4、表5所示。
由表5可知C1與5種元素有著顯著的相關(guān)性,可見許多變量之間直接的相關(guān)性比較強,證明它們存在信息上的重疊。
2.2 主成分表達(dá)式
主成分個數(shù)提取原則為主成分對應(yīng)特征值>1的前m個主成分。特征值在某種程度上可以被看成是表示主成分影響力度大小的指標(biāo),如果特征值1,說明該主成分的解釋力度還不如直接引入原變量的平均解釋力度,因此一般可以用特征值>1作為納入標(biāo)準(zhǔn)。通過表4可知,提取2個主成分,即m=2.從表5可知C1、Zn、Cu、Fe、Ca、Mg在B第一主成分上有較高的載荷,說明B第一主成分基本反映了這些指標(biāo)的信息,K、Na在B第二主成分上有較高的載荷,說明B第二主成分基本反映了K、Na 2個指標(biāo)的信息。所以提取2個主成分是基本反映全部指標(biāo)的信息,所以決定用2個新的變量來代替原來的8個變量。通過SPSS將表5中的數(shù)據(jù)除以主成分相對應(yīng)的特征值開平方根,得到兩主成分中每個指標(biāo)所對應(yīng)的系數(shù)。將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得到主成分表達(dá)式:
由(1)、(2)、(3)式得到B第一主成分F1、B第二主成分F2和綜合主成分F的數(shù)據(jù)及排名,如表6所示。
由表6可以看出第一主成分中以0為臨界值,0.1為修正值,即(-0.1,0.1)為不穩(wěn)定狀態(tài),此狀態(tài)下的就診人員將隨機被確定為患者和健康者中的1個。而當(dāng)F1>0.1時,將此時對應(yīng)的就診人員確定為健康者;當(dāng)F1-0.1時,將此時的就診人員確定為患者。經(jīng)此方法判定的患者與健康者與表1中的患者與健康者基本一致,并且與用綜合主成分分析得到的結(jié)果基本一致。其判定的準(zhǔn)確性可以達(dá)到95%以上,因此具備很強的可信性與科學(xué)性。
本文創(chuàng)新點在于模型中連續(xù)做了2次主成分分析,即二次主成分分析,并伴有大量的數(shù)據(jù)處理和數(shù)據(jù)分析,合理的結(jié)論背后擁有強大的理論支持和數(shù)據(jù)支持,具有很強的科學(xué)性和可信性。不過,確診病人還是需要通過醫(yī)生的具體分析,以達(dá)到所需效果。
評論