節約と資産運用を考えるブログ

将来のために、節約と資産運用をはじめました。 まだまだ勉強中ですので、誤った情報があると思いますので、ご注意ください。

統計学

前期に統計学を受講しましたが、今期も関連科目を受講しています。
今回受講しているのは、「データの分析と知識発見」。

データの分析と知識発見 (放送大学教材)
秋光 淳生
放送大学教育振興会
2016-03-01


統計学を活用して、データ分析を学ぶという授業です。
内容としては、統計学でやったような記述統計や検定、回帰分析も扱います。
さらに、ニューラルネットワークやテキストマイニングなど、最近AI関連でよく聞くキーワードも扱っているようです。

単に理論を学ぶだけでなく、統計ソフトRを使って、授業が進められます。
Rと言えば、私が学生の頃からある無料ソフトです。
学生の頃に名称だけは聞いたことがありますが、使うのは初めてです。

最近の本を読んでいると、統計やニューラルネットワーク関係ではPythonで扱われることが多いので、その点は少し古いのかもしれません。
Rで学んだ内容を、Pythonに読み替えて、復習するとかを独学でやったら、勉強になりそうですね。
どこまで続くかは分かりませんが、RとPythonを同時にやっていきたいと思います(*・ω・)ノ

2019年の目標のひとつ。
「Pythonを勉強して、統計分析に使えるようにする」という目標があります。

全くの初心者なので、最初の具体的な目標として、この試験の合格を目指そうと思います。

「Python3エンジニア認定基礎試験」
公式サイトの詳細はこちら

CBT試験で、Pythonの文法基礎が40問出題されます。
テキストは「Pythonチュートリアル第3版」が指定されています。
Pythonチュートリアル 第3版
Guido van Rossum
オライリージャパン
2016-03-24



受験料が1万円と高いですが、勉強の取っ掛かりとしては良いのではと考えています(*・ω・)ノ



放送大学統計学の試験が終わりました。
統計検定2級に比べると、かなり簡単でした。

テキスト、ノート、電卓が持ち込み可能。
特に、テキストと電卓は必携となっています。
しかし、テキストも電卓も使わなくて解けます。
そのくらい簡単。

授業では難しい内容も扱いますが、50%くらいの理解度でも合格できそうです(*´ω`*)


今回は、主成分分析と因子分析です。
どちらも、複数の変数を、少数の変数に集約するための手法です。

それぞれの特徴は、

主成分分析
  • 複数の変数を組み合わせて、集約した新しい変数を作成する。
  • 最も分散が大きくなるように作成した変数を第1主成分という。
  • 第1主成分と相関がゼロとなる変数を第2主成分という。

因子分析
  • 複数の変数を生み出す要因となる、少数の変数(因子)を作成する。
  • 確率モデルを仮定し、因子を推定する。
テキストでの解説はこの程度で、具体的な計算方法は記載されていません。
各分析手法の違いの正誤問題などがでそうですね。


放送大学「統計学」に、ロジスティック回帰分析が出てきます。
ロジスティック回帰分析は、統計検定2級では出題されない分野です。

ロジスティック回帰分析の特徴をまとめると、以下のようになります。
  • 被説明変数(Y)が、2値データ。
  • ロジット変換により、2値データを連続データに変換する。
  • 最尤法によりパラメータを推定する。
  • eの推定されたパラメータ乗が、オッズ比となる。
パラメータの推計は電卓ではできないので、試験問題には出題されないでしょう。
おそらく、推計結果の解釈かと思います。

とくに、オッズ比が重要そうです。
例えば、病気と喫煙の関係をしめした、下記のような式。

病気の有無 = 0.9×(喫煙の有無)

e^0.9=2.46は、喫煙することで病気になる確率が2.46倍となることを意味します。

通常の回帰分析とは解釈の仕方が異なるので、注意が必要です。


しかし、それ以外は試験に出そうにないので、この点だけを抑えれば良さそうです。



↑このページのトップヘ