趣味工房　ＨＩＲＯ-Ｇ

＜ JetBotの製作その１４　機械学習用WinPC構築完了＞

　やっと「機械学習用WinPC構築」が完了しました！。
前回は、「Ｄｅｆｉｎｅ　ｔｈｅ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋ」の段階でＡｓｓｅｒｔエラーが発生しプログラムの処理が中断しましたが、その原因をPython3.6上で、十分な調査をしないまま、小手先でテストしましたが解決しませんでした。　
　Python3.6にこだわっていましたのは、JetBotのPythoｎのバージョンに合わせるためでしたが、学習専用PCを使う目的は、学習後のデータファイルを入手することにあるので、JetBotのPythonのバージョンにこだわる必要がないことに気づきました。
　そこで写真１のようにPython3.7にバージョンアップして、同様の手順でテストしましたがやはり解決に至りませんでした。

　やはり小手先では解決しないので、「ＣＵＤＡ」、「ＧＰＵ」、「ドライバー」及び「Ｔｏｒｃｈ（ＰｙTｏｒｃｈ）」等の関係を、再調査・確認して作業を進める事とし、Pythonのバージョンも現在インストールしているAnakonda３の最新バージョンのPython3.8.13でシステムを構築する事としました。

　グラフィックボードは既に最新のドライバーをインストールしおり、写真２のようにWindows10で認識されています。　GPU「ＧTＸ１６５０」の「CUDA」との適合性については公式のサイトで再確認し、「ＧTＸ１６５０Ｔｉ」が適合品に記載されていますので、問題ないと思います。

　これで準備が整ったので、再構築を始めようと思い、先ずは念のため事前に、「Ｖｉｓｕａｌ　Ｓｔｕｄｉｏ」の最新版をマイクロソフトサイトからダウンロードし、インストールしました。
　続いて、あらためて写真４の通り「jetbot_38」として、Python3.8.13とそれに関係するファイルをインストールしました。　

　PyTorchとの関連は写真５のように事前に確認する必要がありますので、いろいろサイトを検索の結果、当方のOSは、Windows１０ですが、手順が上手くまとまた次のサイトを参考にしました。

「WIndows11にCUDA+cuDNNをインストールし、PyTorchでGPUを認識をするまでの手順まとめ」

　その確認事項の一つにCUDA　１０．２」は、Windowsではサポートされていないということで、「CUDA　１１．３．１」を選択しました。
PyTorch、Torchvisionのインストールは、何れもターミナルモード
実行しました。　コマンドラインは次の通りです。

>conda install pytorch torchvision torchaudiocudatoolkit=11.3 -c pytorch

>conda　install　torchvision　-c　pytorch

　その他は、現在インストールしているAnaconda３が対応できる最新のバージョンを選択しました結果は、写真５の組合せとは異なり、写真６、７、８のようになりました。　まとめると次のようになります。

　Ｐｙｔｈｏｎ　　３．８．１３
　ＣＵＤＡｔｏｏｌｋｉｔ　　１１．３．１
　ｃｕＤＮＮ　　８．２．１
　Ｐｙｔｏｒｃｈ　１．１０．２
　ｔｏｒｃｈｖｉｓｉｏｎ　　０．１１．３

　以上で全てのインストールを完了しましたので、PCを再起動後、いつもと同様にAnacondaNavigetorを立上げて、「JetBot38」において＜AI No2-12：　JetBotの製作その１２　機械学習用WinPC構築２＞　と同様に「Jupyter　Notebook」を立上げ「collision avoidance」を選択し、「Train mdel」を実行しました。
　しかし、またもや同様に「Ｄｅｆｉｎｅ　ｔｈｅ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋ」の段階でプログラムの処理が中断しました。

　いろいろ再確認しましたが、手順等に間違いは無かったと思いますが、いろいろやってる中で思い違いもあったかもしれませんので、念のため、もう一度気になる点についてひとつひとつ確認しながらやり直すこととしました。
　先ずは、最もややこしい部分のＰｙTｏｒｃｈ関連についてターミナルモードで再インストールを試みました。　コマンドラインは前述と同じで次の通りです。

>conda install pytorch torchvision torchaudiocudatoolkit=11.3 -c pytorch

　再インストールが無事終了しましたので、一度、Anaconda3を終了しPCを再起動させ、早速に「Jupter Notebook」を立上げ「Train mdel」を再実行しました。
　すると、スムースにプログラムは実行され、「Ｄｅｆｉｎｅ　ｔｈｅ　ｎｅｕｒａｌ　ｎｅｔｗｏｒｋ」の段階に入ってもエラーは発生せず、順調にトレーニングが進み、ついに最終目的の「best_model.pth」が作成され、正常にトレーニングは完了しました。

　＜　成功しました実行例は次の通りです。＞

①　写真10のようにデータセットは、圧縮前のデータ「detaset」のみを残しました。

②　写真１１は、「Train mdel」の実行をスタートした画面の写真です。

③　写真１２は、学習回数「NUM_EPOCH（←①１）」が３０回であることと、テストRUNであるため、元の最高のパフォーマンスモデル名の「best_model.pth」との名前を区別するために枝番（_1)を付けて「best_model_1.pth」（←②）とした状況を示した画面です。　因みに、この名前は自由に変更できます。

④　写真１３は、「黒丸←①」が示しているように、無事トレーニングが進行している画面で、トレーニングは３０回実施されます。

写真１４は、「白丸←①」が示しているように、無事30回のトレーニングが終了したことを示しています。　この結果を見ますと、今回の学習回数（エポック数）は１０回程度で十分に思えます。

⑥　写真１５は、「Jupyter　Notebook」を一つ戻して「best_model_1.pth」が作成されていることを確認した画面です。

　以上により、やっとのことで「機械学習用Win PC」構築が完了しました。　
　前回の状況では、まだまだ厄介な事が続くと覚悟してましたが、思いのほかスムースに作業が進みホットしてます。
　このAnacondaの環境は「RStudio」等いろいろ使えますので、JetBotのみに限らず、いろいろな機械学習やデータサイエンスにも対応出来ますので、今後も続けていろいろな面で活用して行きたいと思います。

　後は、「機械学習用　Lｉｎｕｘ PC」の構築を進めたいと思いますが、もともとPythontはLinuxの方がWindowsより相性が良いので、苦難に満ちた今までの経験を生かせば、あまり苦労はせずに済むのではと、楽観的になってますが、どうなるでしょうか。

to AI No2-13 to AI No2-15

to 新テク・アラカルト