基礎から始める人工知能と機械学習|Python向けの機械学習フレームワーク【scikit-learn(サイキットラーン)】とは?



scikit-learn(サイキットラーン)とは

scikit-learn(サイキットラーン)は、「Python向けの機械学習フレームワーク・オープンソースライブラリ」です。
元々、scikit-learnプロジェクトはグーグル・サマー・オブ・コード・プロジェクトscikits.learnとして開始。2015年以降は頻繁に機械学習で活用され、現在はPythonの代表的な機械学習フレームワークとして多くの開発現場で活用されています。オープンソースで公開されているので、個人・商用に限らず誰でも無料で利用することができます。

scikit-learn(サイキットラーン)のWEBサイト

機械学習のライブラリ

scikit-learn(サイキットラーン)は、多く利用される複数のプログラムを使い勝手の良い様に一つのパッケージに集約した「機械学習のライブラリ」です。

scikit-learnは、現在でも活発に開発が行われているため、インターネット上での情報収集も比較的簡単で、サンプルデータなども数多く存在していますので、これからPythonで機械学習を始める方にはおすすめのライブラリです。

scikit-learn(サイキットラーン)の特徴

・機械学習で使用される多くのアルゴリズムに対応している。
・すぐに機械学習を試すことが出来るようにサンプルデータが豊富にある。
・機械学習の結果を検証する機能を持っている。
・機械学習で良く利用されるライブラリ(Pandas、NumPy、Scipy、Matplotlib)などとの相性がよく結び付け安い。
・BSDライセンスのオープンソースため、個人・企業・商用問わず無料での利用が可能。

アルゴリズムチートシート

scikit-learnでは、まづ、どの様な機械学習プログラムを作成するか?を決めます。そのプログラムから最適なアルゴリズムを「アルゴリズムチートシート」から選択します。

アルゴリズムチートシート

どのような機械学習を作成したいのか?どのようにデータを準備しているのか?などの条件を辿って行くことで、アルゴリズムを選択できるようになっています。

機械学習を始めたばかりの場合は、この「アルゴリズムチートシート」を参考にして、どのアルゴリズムを使用するのか良いかを判断し、選択したアルゴリズムでプログラムを作成して行くことで、それぞれのアルゴリズムがどの様な処理に対して有効なのかを理解して行く事が出来るかと思います。

当サイトでは、今後は、scikit-learn(サイキットラーン)を使用する前提で、人工知能・機械学習を行います。



1 個のコメント

  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です