因?yàn)橐銋f(xié)方差。單純的線性變換只是產(chǎn)生了倍數(shù)縮放,無法消除量綱對(duì)協(xié)方差的影響,而協(xié)方差是為了讓投影后方差最大。
在統(tǒng)計(jì)學(xué)中,主成分分析(PCA)是-種簡化數(shù)據(jù)集的技術(shù)。它是一個(gè)線性變換。
這個(gè)變換把數(shù)據(jù)變換,到一個(gè)新的坐標(biāo)系統(tǒng)中,使得任何數(shù)據(jù)投影的第- -大方差在第一個(gè)坐標(biāo)(稱為第-主成分)上,第二大方差在第二個(gè)坐標(biāo)(第二主成分)上,依次類推。
主成分分析經(jīng)常用減少數(shù)據(jù)集的維數(shù),同時(shí)保持?jǐn)?shù)據(jù)集的對(duì)方差貢獻(xiàn)最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。
這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。但是,這也不是一定的,要視具體應(yīng)用而定。