AI-MASTER WIKI

機械学習について

 機械学習は人工知能を設計するうえで非常に重要な技術です.
 このページでは機械学習に関する概要を紹介します.

機械学習とは何か

機械学習とは何かというと、一言で言ってしまえば、よりよい結果を出すために機械が学習して成長してね、というものです。もう少しかためな言い方をするならば、データからくりかえし学習し、よりよい成績を出すための方法を学んだり、データの中にある法則性やパターンを見つけてね、というようなものです。

例えば、コンピュータにりんごの画像を読み込ませても、コンピュータはそれをりんごとは認識していませんが、りんごの写真を大量に準備して、りんごは赤くて丸くて、、などの特徴をコンピュータ自身に発見させることで、りんごの写真を見せた時に、それをりんごだと認識できるようにしたり。囲碁や将棋でどんな局面でどんな手を打ったら勝率が高まるのかということを何度もトライしていくことで学習していったり。どんな文章が書かれているとスパムメールの確率が高いのかといった判断をするために、スパムメールに特有な文章の法則性を見つけていったり。

ひとくちに機械学習と言っても、できることや、その手法はさまざまです。 続いて機械学習を使う目的や方法, メリットデメリットについて説明していきます.

機械学習を使う目的, 機械学習が行うこと

機械学習を使う目的は「知らないことに直面したときにうまい予想を行う」ということや「データ同士の関係性を解明する」ということです。

そのためにはコンピュータを賢くする必要があります。 コンピュータを賢くするためのひとつのアプローチというのが機械学習と呼ばれるものです.

さて、この機械学習についてですが, どういったことを行っているかというと大きく分けて2つのプロセスを行っています。 1つ目のプロセスはデータから賢くなっていく「学習」で, もう1つはデータに対して予想を行う「推論」というプロセスです。

学習

機械学習における「学習」とはデータの中からそのデータの中に潜む特徴といった法則性を見つけ出すことです。

人間においても的確な知識や多くの知識を持っている人の方が大概賢い人であるように, 機械学習においても正確な情報や大量の情報があればあるほど賢く賢くなります。

推論

機械学習における「推論」とはデータから見つけ出した特徴をもとに予想を行うことです。

学習の段階で優れた特徴を見つけ出すことが出来ればもちろん優れた予想を行うことが可能であります. そのため, 機械学習で優れた推論を行うためには優れた学習が必要不可欠となります.

機械学習の種類

教師あり学習

教師あり学習とは、正解・不正解がはっきりしているものの答えを出してほしいときに、何が正解で何が不正解かといういわゆる「正解ラベル」と一緒にデータを学習させるという手法です。例えば、画像に人が写っているか判断させたい時は、写っているか写っていないかというデータを画像データとあわせて機械にわたして、学習させるというものです。主に下の2つの使われ方をされます。

分類問題

分類問題とは、入力したデータが何に、どのカテゴリにあてはまるものなのかを判別するというものです。例えば、この画像はりんごなのかとか、この音声は男性の声なのかとか、YES/NOで答えられる分類(2項分類)の仕方もありますし、この文章がアニメについてなのか、政治についてなのか、歴史についてなのかカテゴリ分類(多項分類)するものもあります。

教師あり学習なので、それがどのカテゴリにあてはまるのか、その物なのかその物じゃないのかという正解ラベルを渡して学習させます。

どのように実装するかなどについては、分類問題のページをご覧ください。

回帰問題

回帰問題とは、入力したデータの場合にはどんな出力がされるのか予測してくれるというものです。例えば、これまでの気温や日照量、天気の推移などのデータから気温を予測したり、過去の株価などからこれからの株価を予測したりといったようなことに使われます。

こちらも教師あり学習のひとつであり、どんなデータだったらどんな答えが出るのかというデータが正解ラベルとして渡され、学習します。

どのように実装するかなどについては、回帰問題?のページをご覧ください。

教師なし学習

クラスタリング

データの特徴からヒントに大雑把にグループ分けを行うことをクラスタリングと呼びます。

例えばデータの境界線を決められそうであれば境界線を決めてグループに分けることができます。

cluster01.png cluster02.png



例えばこのようなネットワーク構造ではどことなくグループ出来ていそうなイメージがあるのでグループ分けができそうです。
cluster_network01.png cluster_network02.png

強化学習

強化学習とは人工知能に実際にあれこれやらせてみて, 成功や失敗をたくさん経験させてどんどん賢くさせるアルゴリズムです.

詳しくは強化学習の項目をご覧ください。

機械学習のメリットとデメリット

機械学習にも得手不得手があるため, 人工知能を作りたい場合は本当に機械学習が必要であるかはよく検討する必要がります。 参考に, 機械学習を用いた際の御利益と機械学習を用いる際の問題点を述べておきます。

メリット

  • 学習次第で人の勘と経験をはるかに上回る優れた予想が行える
  • データの特徴を見つけるのを自動で行ってくれる
  • 人間では扱いきれない膨大なデータに対する予想が行える

デメリット

  • 大量のデータがあることを前提とした技術であること
  • 過学習(データの丸暗記)を引き起こすと予想精度が極端に悪くなる
  • 計算のコストが大きい(高性能なコンピュータが必要となる)

ただし, 機械学習は大量のデータを用いることを前提とした技術であるとは書きましたがデータがどうしても手に入らなくて少ないデータでどうにかしなければならない場面ということも十分想定されます。
このように情報が少ない場面を想定して対処することをスパースモデリングと呼びますが, これを機械学習に応用してデータが少なくてもうまい予想を行えるようにすることが現在積極的に研究されています.


添付ファイル: filecluster_network02.png 33件 [詳細] filecluster_network01.png 37件 [詳細] filecluster02.png 37件 [詳細] filecluster01.png 33件 [詳細]