てんぺるのぶろぐ

IT関連のこと、体験談、備忘録など。文系エンジニア、もがきます。

機械学習-学習メモ1「機械学習の全体像」

最近ようやく機械学習の勉強をしはじめました。「ITエンジニアのための機械学習理論入門」を読んでいるので、そこで学んだことを踏まえて、少しずつ機械学習についてまとめようと思います。※個人的な解釈や他の書籍で参考にしたこと等も含みます。

ITエンジニアのための機械学習理論入門

ITエンジニアのための機械学習理論入門

 

機械学習とは

過去のデータを利用することで、未来(未知)のデータを予測したり、新しく登場したデータを分類したりすること。また、それを行うためのアルゴリズムの総称。

統計学との違い

統計学はデータの「説明」(平均や分散はいくつで、どういう分布に従っているかなど)に重きを置き、 機械学習はデータの「予測、分類など」に重きを置く、とか言われている。機械学習において統計学は、予測、分類などを行うための1つの手法(アルゴリズムとして利用されている。
 

予測のアルゴリズム

主な「予測」のアルゴリズムとして、1.最小二乗法 2.最尤推定法 3.ベイズ推定法の3つが存在する。

 

分類のアルゴリズム

 主な「分類」のアルゴリズムとして、1.パーセプトロン 2.ロジスティック回帰の2つが存在する。

 

クラスタリングアルゴリズム

クラスタリングとはグループ化のこと。

主な「クラスタリング」のアルゴリズムとして、1.k平均法と2.EMアルゴリズムの2つが存在する。

 

その他のアルゴリズム

上記アルゴリズムに加えて他に、類似マッチング、共起分析、リンク予測などのアルゴリズムが存在する。

 

今回はここまで

自分で言うのもなんですが、内容薄いですね(笑)

それぞれのアルゴリズムを理解したら、概要を追加で書き込んでみようかな。

 

次からはそれぞれのアルゴリズムについて深く見ていきたいと思います。次回は「最小二乗法」を扱う予定です。