文字認識の例など

 
 最近のAIによる認識というと、画像認識、音声認識が認識の第一歩とされていますので、AIとは、どのようなプロセスで処理されるか学習してみました。
 
 今から20年程前、私は入力した音声、画像などを周波数分析・ウェーブレット変換などを行い、様々な音、画像の解析を行っていました。
 
 例えば、生活音(洗濯機の音なのかテレビの音なのか、トイレの音なのか)を判定するのにニューラルネットなどを使っていました。

 しかしながら、音などはその部屋の壁の材質により、周波数分析を行っても音を特定することは不可能に近いものがあり、音だけでは難しいものがありました。それは、収集するデータのサンプル数が極端に少なかったということもありました。
 ところが、最近のAIブームで様々な学習データセットの入手が容易となっていますので、試しにAIによる文字認識を例に学習データを利用して機械学習の能力を学習してみることにしました。
 
 実際に手順に従って文字認識の手順通りに行ってみましたが、確かに苦も無く認識を行うことが出来ました。
 これは、予め実験データを利用してしているので、プロセスをPythonで打ち込んでいけば確認することができました。同じことを音について行えば良いわけですが、先に書きましたように状況によって、認識精度はことなります。
 
 ただし、分析(認識)に利用するデータの入手先、利用するライブラリの選択が初心者にとって判らないということがありますが、この場合はこのライブラリを使えば良いということは理解できました。
 とりあえず、次は分類について、どのように行うのか試して見ます。
 
 画像認識などもっと高度な処理をしたいところですが、今使っているマシンスペックではあまり効果が期待できませんので、Tensolflowを使った画像認識は、当分行いませんのであしからず。

アヤメの分類

次の例は「あやめ」を分類するものですが、あまりおもしろくないサンプルですが、なれるためにやってみます。

 やってみましたがAIというか、むかしやった統計手法でやった方が良いという感想です。
 ここまで、Python3入門3入門ノートに掲載されていた例で、そのほか、ボストンの住宅価格を分析する例がありましたが、これは回帰分析ですので統計の問題です。

 私の購入したAIの本に掲載されていた例は、基本的に統計分析です。AIらしい解析は文字認識だけですが、これも20年にやったナンバープレート認識と同じですが、精度が良くなった?ということだけでした。これが、最近のAIの本質でしょうか。
 今のAIは昔のパターン認識と比較して本当に精度が良くなったという判断はできませんでした。違いは学習するデータが、膨大になったということだけです。

 最近のAIはなんでも出来るようなイメージですが、取り扱うデータをよく検討することが必要と思いました。
 当たり前のことですが、AIを使うには対象とする分析データを良く検討してアルゴリズムを選ぶということが必要だということがよくわかりました。

 ここまでの結論は、以下の通りです。
新しいAI的な手法は、ニューラルネットの進化形のTensorFlowだけです。多分、これだけマスターすればOKだと思われます。
 データ分析として、Pythonとそのライブラリを使えば、AIポイことが比較的容易にできるということです。
 
   
2017/11/24(金)

 TensorFlowをwindows環境でインストールしようと、インターネットで調べましたが、今使っているマシンがwindows10の32ビットマシンで、インストールができないと分かりました。
 したがって、64ビットマシンを購入する必要がありますので、当分Tensorflowは試験できないということが、はっきりと分かりました。大ショック。
 
   
2017/11/29/(水)

 Pythonで機械学習の勉強をしてみようと思い、ライブラリscikit-learnのNumPy、matplotlibなどのサンプルで機械学習の練習をすることにしました。
 とりあえず、webのhttp://scikit-learn.org/stableに掲載されているサンプルを利用して、データ分析、機械学習ができればやってみます
 
   
2017/12/4(月)

 Pythonで利用するライブラリで、画像関係のpillowと配列関係のnumpyを使って、画像の変形などを行いました。
 Pythonはライブラリが豊富ですので、これらを利用するのも大変です。
 
2017/12/5(火)

 Pythonの画像処理ライブラリで、ロボホンの塗り絵を生成しました。

            左:オリジナル写真                          右:塗り絵
   

以降、NumPyライブラリにより、効率的に多次元配列を扱う練習を行います。
 
 
 
 
 
 
   
   
   
前のページへ
 
ホームページへ戻る