-+

趣味工房 HIRO-G


< JetBotの製作その14 機械学習用WinPC構築完了 >


 やっと「機械学習用WinPC構築」が完了しました!。
前回は、「Define the neural network」の段階でAssertエラーが発生しプログラムの処理が中断しましたが、その原因をPython3.6上で、十分な調査をしないまま、小手先でテストしましたが解決しませんでした。 
 Python3.6にこだわっていましたのは、JetBotのPythonのバージョンに合わせるためでしたが、学習専用PCを使う目的は、学習後のデータファイルを入手することにあるので、JetBotのPythonのバージョンにこだわる必要がないことに気づきました。
 そこで写真1のようにPython3.7にバージョンアップして、同様の手順でテストしましたがやはり解決に至りませんでした。

 やはり小手先では解決しないので、「CUDA」、「GPU」、「ドライバー」及び「Torch(PyTorch)」等の関係を、再調査・確認して作業を進める事とし、Pythonのバージョンも現在インストールしているAnakonda3の最新バージョンのPython3.8.13でシステムを構築する事としました。

 グラフィックボードは既に最新のドライバーをインストールしおり、写真2のようにWindows10で認識されています。 GPU「GTX 1650」「CUDA」との適合性については公式のサイトで再確認し、「GTX 1650Ti」が適合品に記載されていますので、問題ないと思います。

 これで準備が整ったので、再構築を始めようと思い、先ずは念のため事前に、「Visual Studio」の最新版をマイクロソフトサイトからダウンロードし、インストールしました。
 続いて、あらためて写真4の通り「jetbot_38」として、Python3.8.13とそれに関係するファイルをインストールしました。 

 PyTorchとの関連は写真5のように事前に確認する必要がありますので、いろいろサイトを検索の結果、当方のOSは、Windows10ですが、手順が上手くまとまた次のサイトを参考にしました。

「WIndows11にCUDA+cuDNNをインストールし、PyTorchでGPUを認識をするまでの手順まとめ」

 その確認事項の一つにCUDA 10.2」は、Windowsではサポートされていないということで、「CUDA 11.3.1」を選択しました。
PyTorch、Torchvisionのインストールは、何れもターミナルモード
実行しました。 コマンドラインは次の通りです。

>conda install pytorch torchvision torchaudiocudatoolkit=11.3 -c pytorch

>conda install torchvision -c pytorch

 その他は、現在インストールしているAnaconda3が対応できる最新のバージョンを選択しました結果は、写真5の組合せとは異なり、写真6、7、8のようになりました。 まとめると次のようになります。

 Python  3.8.13
 CUDAtoolkit  11.3.1
 cuDNN  8.2.1
 Pytorch  1.10.2
 torchvision  0.11.3

 以上で全てのインストールを完了しましたので、PCを再起動後、いつもと同様にAnacondaNavigetorを立上げて、「JetBot38」において<AI No2-12: JetBotの製作その12  機械学習用WinPC構築2> と同様に「Jupyter Notebook」を立上げ「collision avoidance」を選択し、「Train mdel」を実行しました。
 しかし、またもや同様に「Define the neural network」の段階でプログラムの処理が中断しました。

 いろいろ再確認しましたが、手順等に間違いは無かったと思いますが、いろいろやってる中で思い違いもあったかもしれませんので、念のため、もう一度気になる点についてひとつひとつ確認しながらやり直すこととしました。
 先ずは、最もややこしい部分のPyTorch関連についてターミナルモードで再インストールを試みました。 コマンドラインは前述と同じで次の通りです。

>conda install pytorch torchvision torchaudiocudatoolkit=11.3 -c pytorch

 再インストールが無事終了しましたので、一度、Anaconda3を終了しPCを再起動させ、早速に「Jupter Notebook」を立上げ「Train mdel」を再実行しました。
 すると、スムースにプログラムは実行され、「Define the neural network」の段階に入ってもエラーは発生せず、順調にトレーニングが進み、ついに最終目的の「best_model.pth」が作成され、正常にトレーニングは完了しました。


 < 成功しました実行例は次の通りです。>

@ 写真10のようにデータセットは、圧縮前のデータ「detaset」のみを残しました。

A 写真11は、「Train mdel」の実行をスタートした画面の写真です。

B 写真12は、学習回数「NUM_EPOCH(←@1)」30回であることと、テストRUNであるため、元の最高のパフォーマンスモデル名の「best_model.pth」との名前を区別するために枝番(_1)を付けて「best_model_1.pth」(←Aとした状況を示した画面です。 因みに、この名前は自由に変更できます。

C 写真13は、「黒丸←@が示しているように、無事トレーニングが進行している画面で、トレーニングは30回実施されます。

写真14は、「白丸←@が示しているように、無事30回のトレーニングが終了したことを示しています。 この結果を見ますと、今回の学習回数(エポック数)は10回程度で十分に思えます。

E 写真15は、「Jupyter Notebook」を一つ戻して「best_model_1.pth」が作成されていることを確認した画面です。


 以上により、やっとのことで「機械学習用Win PC」構築が完了しました。 
 前回の状況では、まだまだ厄介な事が続くと覚悟してましたが、思いのほかスムースに作業が進みホットしてます。
 このAnacondaの環境は「RStudio」等いろいろ使えますので、JetBotのみに限らず、いろいろな機械学習やデータサイエンスにも対応出来ますので、今後も続けていろいろな面で活用して行きたいと思います。

 後は、「機械学習用 Linux PC」の構築を進めたいと思いますが、もともとPythontはLinuxの方がWindowsより相性が良いので、苦難に満ちた今までの経験を生かせば、あまり苦労はせずに済むのではと、楽観的になってますが、どうなるでしょうか。








to AI No2-13               to AI No2-15  


to 新テク・アラカルト










          写真10 トレーニングモデル選択画面

                                       

      
         写真11 トレーニングの実行開始画面



                   
                   写真12 最適化モデルネームの設定




        写真13 トレーニング進行中の画面




        写真14 トレーニング完了の画面




        写真15 最適化のファイル作成の確認
                   
< TREX450 SPORT >




 SDXに続き墜落。


 以下同文。








AI No2-14



JetBotの製作その14 機械学習用WinPC構築完了
2022年9月7日 



写真1 「Python3.7」関連のインストール




写真2 「GPU]の確認




写真3 「GTX 1650」のCUDA適合の確認




写真4 「Python3.8」関連のインストール




写真5 「PyTorch」インストールの参考




写真6 「Python」、「PyTorch」のインストールとバージョン




写真7 「CUDAtoolkit」、「cuDNN」のインストールとバージョン




写真8 「Torchvision」のインストールとバージョン




写真9 「PyTorch」のターミナルモードでの再インストール


??