新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 一種二次主成分分析模型解決病情確診的實現(xiàn)

一種二次主成分分析模型解決病情確診的實現(xiàn)

作者: 時間:2012-02-09 來源:網(wǎng)絡 收藏

在用統(tǒng)計方法研究這個多變量的課題時,變量個數(shù)太多就會增加課題的復雜性。人們自然希望變量個數(shù)較少而得到的信息較多。在很多情形,變量之間是有一定的相關關系的,當兩個變量之間有一定相關關系時,可以解釋為這兩個變量反映此課題的信息有一定的重疊。主是對于原先提出的所有變量,建立盡可能少的新變量,使得這些新變量是兩兩不相關的,而且這些新變量在反映課題的信息方面盡可能保持原有的信息。

本文引用地址:http://2s4d.com/article/149727.htm

  主(Principal Component Analysis,PCA), 將多個變量通過線性變換以選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法。又稱主分量分析。在實際課題中,為了全面分析問題,往往提出很多與此有關的變量(或因素),因為每個變量都在不同程度上反映這個課題的某些信息。主分析首先是由K.皮爾森對非隨機變量引入的,爾后H.霍特林將此方法推廣到隨機向量的情形。信息的大小通常用離差平方和或方差來衡量。

  人們到醫(yī)院就診時,通常要化驗指標來協(xié)助醫(yī)生的診斷。診斷就診人員是否患腎炎時通常要化驗人體內(nèi)各種元素含量,主要包括鋅(Zn)、銅(Cu)、鐵(Fe)、鈣(Ca)、鎂(Mg)、鉀(K)及鈉(Na)。表1是病例的化驗結果,其中1~30號病例是已經(jīng)為腎炎病人的化驗結果,31~60號病例是已經(jīng)確定為健康人的結果[2]。在論文中列出的數(shù)據(jù)是原始數(shù)據(jù)中1~10號病例及31~40號病例的數(shù)據(jù),運用主成分計算時以所有數(shù)據(jù)為初始數(shù)據(jù)。

確診病例的化驗結果

  1 主成分分析

  主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標。通常數(shù)學上的處理就是將原來P個指標作線性組合,作為新的綜合指標。最經(jīng)典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F(xiàn)1已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學語言表達就是要求Cov(F1, F2)=0,則稱F2為第二主成分,依此類推可以構造出第三、第四,……,第P個主成分。

公式

  2 應用

  2.1 問題分析

公式

特征值

特征向量


上一頁 1 2 下一頁

評論


相關推薦

技術專區(qū)

關閉