節約と資産運用を考えるブログ

将来のために、節約と資産運用をはじめました。 まだまだ勉強中ですので、誤った情報があると思いますので、ご注意ください。

統計学

2019年度前期は、放送大学で「データの分析と知識発見」を受講しています。
試験も近くなってきたので、内容を整理していこうと思います( ´∀`)つ

まずは全体の流れ。
第1章から第4章は〈Rの使い方〉が中心です。
Rの基本的使い方、平均分散などのコマンド、データのインポート、グラフ作成などなど。
この辺りは数式もほとんどなく、Rを使いながら、慣れていくという感じです。

第5章から第10章は〈統計学〉が中心です。
検定、回帰分析、主成分分析、因子分析、多元尺度法が説明されています。
各章の前半は数式中心の解説があり、後半はRでの実習です。
ベクトル、行列の知識が必要なので、挫折ポイントになるかもしれません。
統計検定2級程度の知識があると、大丈夫そうです。

第11章から第15章は〈その他の分析〉という感じです。
クラスター分析、アソシエーション分析、決定木、ニューラルネットワーク、テキストマイニング。
この講義で最も面白いパートです。
各章の前半は分析手法の解説ですが、数式は少な目で、文字による解説が中心です。
興味がある人は参考文献を読んでみてねという感じです。
後半は同じくRによる実習です。


以上のような構成です。
第5章から第10章が山場ですね。
過去問を見ると期末試験はマーク式が中心なので、
数式を完全に理解できなくても合格はできそうです(*・ω・)ノ



前期に統計学を受講しましたが、今期も関連科目を受講しています。
今回受講しているのは、「データの分析と知識発見」。

データの分析と知識発見 (放送大学教材)
秋光 淳生
放送大学教育振興会
2016-03-01


統計学を活用して、データ分析を学ぶという授業です。
内容としては、統計学でやったような記述統計や検定、回帰分析も扱います。
さらに、ニューラルネットワークやテキストマイニングなど、最近AI関連でよく聞くキーワードも扱っているようです。

単に理論を学ぶだけでなく、統計ソフトRを使って、授業が進められます。
Rと言えば、私が学生の頃からある無料ソフトです。
学生の頃に名称だけは聞いたことがありますが、使うのは初めてです。

最近の本を読んでいると、統計やニューラルネットワーク関係ではPythonで扱われることが多いので、その点は少し古いのかもしれません。
Rで学んだ内容を、Pythonに読み替えて、復習するとかを独学でやったら、勉強になりそうですね。
どこまで続くかは分かりませんが、RとPythonを同時にやっていきたいと思います(*・ω・)ノ

2019年の目標のひとつ。
「Pythonを勉強して、統計分析に使えるようにする」という目標があります。

全くの初心者なので、最初の具体的な目標として、この試験の合格を目指そうと思います。

「Python3エンジニア認定基礎試験」
公式サイトの詳細はこちら

CBT試験で、Pythonの文法基礎が40問出題されます。
テキストは「Pythonチュートリアル第3版」が指定されています。
Pythonチュートリアル 第3版
Guido van Rossum
オライリージャパン
2016-03-24



受験料が1万円と高いですが、勉強の取っ掛かりとしては良いのではと考えています(*・ω・)ノ



放送大学統計学の試験が終わりました。
統計検定2級に比べると、かなり簡単でした。

テキスト、ノート、電卓が持ち込み可能。
特に、テキストと電卓は必携となっています。
しかし、テキストも電卓も使わなくて解けます。
そのくらい簡単。

授業では難しい内容も扱いますが、50%くらいの理解度でも合格できそうです(*´ω`*)


今回は、主成分分析と因子分析です。
どちらも、複数の変数を、少数の変数に集約するための手法です。

それぞれの特徴は、

主成分分析
  • 複数の変数を組み合わせて、集約した新しい変数を作成する。
  • 最も分散が大きくなるように作成した変数を第1主成分という。
  • 第1主成分と相関がゼロとなる変数を第2主成分という。

因子分析
  • 複数の変数を生み出す要因となる、少数の変数(因子)を作成する。
  • 確率モデルを仮定し、因子を推定する。
テキストでの解説はこの程度で、具体的な計算方法は記載されていません。
各分析手法の違いの正誤問題などがでそうですね。


↑このページのトップヘ