具体的な数値例で主成分分析を確認してみましょう。
点数データ

散布図にするとこうなります。

主成分分析1



計算すると、
 算数の分散は1.4、
 理科の分散は2.0、
 共分散は1.4
となります。


「理系能力分散 = a^2×算数分散 +2ab×共分散 + b^2×理科分散」に代入すると・・・

<式1>
理系能力分散 = 1.4×a^2  + 2.8×ab + 2×b^2

この<式1>が最大となるようなaとbを、<式2>の制約下で探します。

<式2>
a^2 + b^2 = 1


ラグランジュ乗数法で最適化条件を計算すると・・・

<式3>
1.4×a + 1.4×b = λ×a
1.4×a + 2.0×b = λ×b
a^2  + b^2  = 1



この連立方程式を解くと、aとbとλが計算できます。
しかし、2次方程式のため、手計算は大変です( -д-)ノ

そのため、エクセルの機能を使って、数値計算すると・・・

<式4>
a = 0.63
b = 0.78
λ =  3.13


となります。


「理系能力 = a×算数点数 + b×理科点数」に結果を代入すると・・・

<式5>
理系能力 = 0.63×算数点数 + 0.78×理科点数


<式5>を使えば、各生徒の理系能力を計算できます。
Aさんは1.4、Bさんは2.0という感じになります。


<式5>を見ると、算数の点数よりも理科の点数の方を高く評価しています。
これは、算数の分散よりも、理科の分散の方が大きいので、各生徒の違いを見えやすくした結果です。

具体的な数値で計算してみると、そんなところも分かりますね(*・ω・)ノ



【関連記事】
主成分分析のイメージはこちら。



主成分分析の計算方法はこちら。





スポンサードリンク