Pythonデータ分析試験のテキストにもなっている、こちらの本を読み進めていきます。



まずは、本の構成ですが、下記のようになっています。

  1. データ分析エンジニアの役割
  2. Pythonと環境
  3. 数学の基礎
  4. ライブラリによる分析の実践
  5. データ収集と加工
第1章は、Pythonやデータ分析等の説明です。
機械学習の分類やプロセス概要が文字と図で記載されています。

第2章は、Pythonの使い方。
インストール方法やJupyter Notebookの使い方が説明されています。

第3章は、数学です。Pythonはでてきません。
行列、微分、確率が中心ですので、統計学を勉強した方は流し読みできそうです。

第4章は、このテキストのメインパートで、分析の実践です。
少し詳しく見ていくと・・・
  • NumPy:行列形式の扱い方
  • pandas:シリーズとデータフレームの扱い方
  • Matplotib:グラフ描写
  • scikit-learn:回帰分析、主成分分析、クラスタリングなどの分析手法
特に、scikit-learnの説明はメイン中のメインですが、統計学を勉強している場合は聞いたことがある内容が多いですね。
特に、放送大学の「データ分析と知識発見」を受講した方は、Rで勉強した内容をPythonでやってみるという感じです。



第5章は、自然言語処理や画像処理です。
自然言語処理も、放送大学の「データ分析と知識発見」で少しでてきましたね。
画像データ処理は、まったくの初めてなので、どんな感じでしょうか?



こうしてみると、放送大学の「統計学」や「データ分析と知識発見」を受講していると、かなり勉強しやすそうですね(*・ω・)ノ


スポンサードリンク