20210910のTensorFlowに関する記事は3件です。

投稿日：2021-09-10T23:06:19+09:00

M1 Mac + Dockerの環境でTensorflowを使う

pip install tensorflowできない！ M1チップのMacではpipでTensorflowをインストールできません。AArch64に対応したパッケージはPyPIで公開されていないようです。Macに直接インストールする方法はいくつかあるみたいですが、環境は汚したくないのでDocker上で使いたいところ。少し調べたところ、ビルドするしかないみたいだったので、ビルドしてみました！使えるようになるまで結構ハマるポイントがあったので、備忘録として残しておきます。公式ドキュメントにビルド方法が書かれているが https://www.tensorflow.org/install/source?hl=ja ここにビルド方法が書かれています。ビルド環境を用意してソースコードからビルドビルド環境が用意されたDockerイメージ上でビルド上記の2通りの方法がありました。Docker環境でTensorflowを使いたいので、まずは2の方法でビルドを試みました。が、ビルドできませんでした。ビルドツールのBazelがx64向けのイメージだったようで、Bazelが使えず。。。ということで、M1 Mac + Dockerの環境でTensorflowを使うにはビルド環境を一から準備してビルドしないと使えないようです。いくつかハマりどころがあります！基本的には公式ドキュメントの通りに進めていけばいいのですが Bazelのビルドオプション依存パッケージのh5py numpyのバージョンここでハマりました。なお、Bazelは公式ドキュメントに「Use Bazelisk (recommended)」とあったので、npmを使ってインストールしました。 Bazelのビルドオプション bazel build [--config=option] //tensorflow/tools/pip_package:build_pip_package このコマンドでビルドしますが、メモリ8GのMac Book Airではオプション指定無しだとビルド中にメモリが足りなくなり完了しませんでした。公式ドキュメントには--local_ram_resources=2048でRAM使用量を制限してくださいとありますが、このオプションだけではまだメモリの問題で完了しません。最終的にメモリを最大8GBまで使えるようにDockerDesktopの設定を変更オプションは--local_ram_resources=2048 --jobs=1を指定とすることでビルドできるようになりました。Dockerの設定は8GB未満でもいいかもしれませんが、最大にしておくといいと思います。（ビルド完了後は元に戻すことを推奨） --jobsオプションは並列数を指定するオプションで、少しでもメモリ使用量を減らしたいので1にしています。2でもギリギリいけるかもしれませんが、メモリ８GBの環境では1が無難です。依存パッケージのh5pyも・・・ Bazelのビルドが完了すれば、wheelの作成までは問題なく進められると思います。しかし、作成したパッケージをpipでインストールするときに、またハマりました。依存パッケージのh5pyが、これも、AArch64に対応したパッケージがPyPIで公開されておらずpipでインストールできず、Tensorflowもインストールできません。調べてみると、幸いapt-getでlibhdf5-devをインストールすることで、h5pyが使えるようになるみたいだったので、その方法を取りました。 apt-get install -y libhdf5-dev でインストール後、 pip install --no-binary=h5py h5py とすることで、インストールできました。参考: https://github.com/h5py/h5py/issues/1181 numpyのバージョンこれでようやくTensorflowをpipでインストールできるようになりました。しかし！ import tensorflowでエラーが出ました...。 RuntimeError: module compiled against API versionだそうです。どうやらTensorflowが要求するバージョンのnumpyがインストールされた環境でビルドしないといけなかったようです。今回はTensorflow2.6で、numpyは1.19を要求されているので、 pip install numpy==1.19.2 でnumpyをインストールし直して、再度Tensorflowをビルドしました。Bazelのビルドからやり直しましたが、wheelの作成し直しだけでいいかもしれません。まとめ AArch64環境でTensorflowをビルドする場合は以下の事項に注意！ビルド環境に合わせてBazelのビルドオプションを指定する（--local_ram_resourcesだけでなく--jobsも使う） numpyのバージョンはTensorflowのバージョンに合わせたものをインストールしないといけない h5pyはapt-getでインストールした上で、pipの--no-binaryでインストールビルドできてしまえば大したことないのですが、結構大変でした。（Bazelのビルド時間が結構長い。。。）ここまで説明しておいてなんですが、おそらくDockerHubを探せばAArch64環境用のTensorflowイメージがあると思うので、それを使うのが手っ取り早いと思います。ただ、ビルド設定で色々カスタマイズしたパッケージができます。（普通に使う分にはデフォルト設定で十分ですが） Tensorflowをソースコードからビルドしようとしている人の一助となれば幸いです。

　 Tweet
Qiitaで続きを読む

投稿日：2021-09-10T23:06:19+09:00

M1 Mac + Dockerの環境でTensorflowをビルドする

pip install tensorflowできない！ M1チップのMacではpipでTensorflowをインストールできません。AArch64に対応したパッケージはPyPIで公開されていないようです。Macに直接インストールする方法はいくつかあるみたいですが、環境は汚したくないのでDocker上で使いたいところ。少し調べたところ、ビルドするしかないみたいだったので、ビルドしてみました！使えるようになるまで結構ハマるポイントがあったので、備忘録として残しておきます。公式ドキュメントにビルド方法が書かれているが https://www.tensorflow.org/install/source?hl=ja ここにビルド方法が書かれています。ビルド環境を用意してソースコードからビルドビルド環境が用意されたDockerイメージ上でビルド上記の2通りの方法がありました。Docker環境でTensorflowを使いたいので、まずは2の方法でビルドを試みました。が、ビルドできませんでした。ビルドツールのBazelがx64向けのイメージだったようで、Bazelが使えず。。。ということで、M1 Mac + Dockerの環境でTensorflowを使うにはビルド環境を一から準備してビルドしないと使えないようです。いくつかハマりどころがあります！基本的には公式ドキュメントの通りに進めていけばいいのですが Bazelのビルドオプション依存パッケージのh5py numpyのバージョンここでハマりました。なお、Bazelは公式ドキュメントに「Use Bazelisk (recommended)」とあったので、npmを使ってインストールしました。 Bazelのビルドオプション bazel build [--config=option] //tensorflow/tools/pip_package:build_pip_package このコマンドでビルドしますが、メモリ8GのMac Book Airではオプション指定無しだとビルド中にメモリが足りなくなり完了しませんでした。公式ドキュメントには--local_ram_resources=2048でRAM使用量を制限してくださいとありますが、このオプションだけではまだメモリの問題で完了しません。最終的にメモリを最大8GBまで使えるようにDockerDesktopの設定を変更オプションは--local_ram_resources=2048 --jobs=1を指定とすることでビルドできるようになりました。Dockerの設定は8GB未満でもいいかもしれませんが、最大にしておくといいと思います。（ビルド完了後は元に戻すことを推奨） --jobsオプションは並列数を指定するオプションで、少しでもメモリ使用量を減らしたいので1にしています。2でもギリギリいけるかもしれませんが、メモリ８GBの環境では1が無難です。依存パッケージのh5pyも・・・ Bazelのビルドが完了すれば、wheelの作成までは問題なく進められると思います。しかし、作成したパッケージをpipでインストールするときに、またハマりました。依存パッケージのh5pyが、これも、AArch64に対応したパッケージがPyPIで公開されておらずpipでインストールできず、Tensorflowもインストールできません。調べてみると、幸いapt-getでlibhdf5-devをインストールすることで、h5pyが使えるようになるみたいだったので、その方法を取りました。 apt-get install -y libhdf5-dev でインストール後、 pip install --no-binary=h5py h5py とすることで、インストールできました。参考: https://github.com/h5py/h5py/issues/1181 numpyのバージョンこれでようやくTensorflowをpipでインストールできるようになりました。しかし！ import tensorflowでエラーが出ました...。 RuntimeError: module compiled against API versionだそうです。どうやらTensorflowが要求するバージョンのnumpyがインストールされた環境でビルドしないといけなかったようです。今回はTensorflow2.6で、numpyは1.19を要求されているので、 pip install numpy==1.19.2 でnumpyをインストールし直して、再度Tensorflowをビルドしました。Bazelのビルドからやり直しましたが、wheelの作成し直しだけでいいかもしれません。まとめ AArch64環境でTensorflowをビルドする場合は以下の事項に注意！ビルド環境に合わせてBazelのビルドオプションを指定する（--local_ram_resourcesだけでなく--jobsも使う） numpyのバージョンはTensorflowのバージョンに合わせたものをインストールしないといけない h5pyはapt-getでインストールした上で、pipの--no-binaryでインストールビルドできてしまえば大したことないのですが、結構大変でした。（Bazelのビルド時間が結構長い。。。）ここまで説明しておいてなんですが、おそらくDockerHubを探せばAArch64環境用のTensorflowイメージがあると思うので、それを使うのが手っ取り早いと思います。ただ、ビルド設定で色々カスタマイズしたパッケージができます。（普通に使う分にはデフォルト設定で十分ですが） Tensorflowをソースコードからビルドしようとしている人の一助となれば幸いです。

　 Tweet
Qiitaで続きを読む

投稿日：2021-09-10T13:38:48+09:00

ランド研究所の「機械学習による航空支配」を実装する（その１９）：最後に

本記事は、ランド研究所の「機械学習による航空支配」を実装する（その１9）です。（今回の記事が最後です）。 Air Dominance Through Machine Learning: A Preliminary Exploration of Artificial Intelligence–Assisted Mission Planning, 2020 ランド研究所のレポートに記載されている１次元プランニング問題、２次元プランニング問題に対し、GAN と強化学習を適用し実装した感想、反省点、疑問点を中心にまとめ、今後に活かしたいと思います。これまでの強化学習で、使用したコードは、下記 GitHub にあります。１次元問題（GAN） Conditional GANを使ったプランナー１次元問題（強化学習）強化学習を使ったプランナー 2次元問題（強化学習）強化学習を使ったプランナー感想：GAN によるプランニングの将来性成功例（や失敗例）が、山ほどあるような問題で、成功例と似た静的なプランを生成するには結構使えるのではないか、と感じました。ただし、例がないような突飛なプランは生成できません。２次元問題のような時系列のプランニングができるのかどうかは、もっと GAN の勉強をしないと判りません。何らかの工夫が必要だろうと思います。感想：現在の強化学習の有効性と限界今回は、アクション空間が連続だったので、評判が良い SAC（Soft Actor Critic）を使用しました。このアルゴリズムは、思ったよりもパワフルで、今回ぐらいの問題なら有用性が高いと感じました。時間があれば、PPO と比較したかったところです。空間的なプランニングに比べ、時間的なプランニングは、遥かに難しかったです。スパースな終端報酬だけでは学習は進まず、報酬シェーピングが必要でした。これは、SACに限らず、強化学習全体に言えるような気がします。空間的なプランニングでは、射程のギリギリのところをきちんと見極めることができました。これは、予想以上の性能でした。一方、時間的なプランニングでは、数タイムステップのタイミングを合わせるために報酬シェーピングに頼らざるを得ませんでした。原因は探索時に時間的なタイミングが合うケースが稀にしか発生しないことに問題があると考えました。このため、報酬シェーピングで、タイミングが合う方向に探索をさせることで無事に学習ができました。報酬シェーピングでは、どういう方向に学習させるべきかをよく考えることが重要だと思いました。感想：観測を相対量だけで行うことの有用性観測を、慣性空間の座標値ではなく、相対的な距離と角度に変更することで、並行移動や回転に対して不変な観測量を得ることができます。その結果、探索空間をかなり小さくできるので非常に有効です。最初は、ランド研究所のレポートに従って、慣性空間の（x, y）座標値で学習させようとしましたが、問題を少し難しくするとすぐに学習が進まなくなってしまいました。同じ問題でも、観測空間が小さくなるように観測量を工夫することは非常に重要だと感じました。感想：学習した解のロバストネス（汎化能力）距離やイニシャル・ヘディングエラーに対し、想像以上の十分な汎化能力（ロバストネス）を示しました。特に、イニシャル・ヘディングエラーに対しては、360度の汎化能力を達成しました。相対量でない観測量を用いた場合、ほとんど汎化能力はありませんでした。明記されていませんが、ランド研究所のレポートでも、汎化能力は貧弱だった感じでした。相対的な観測量にすることで、360度の全周空間を小さな観測空間に変換できるので、汎化能力が向上したものと思われます。疑問：各プランの統一的な取り扱い今回は、４種類のプランニング問題に対し、別々のニューラルネットをトレーニングしました。理論的には、もっと大きくて深いネットを用いれば、統一的に４種類の問題を扱うことができるはずです。つまり、1つのニューラルネットで４種類のプランニング問題すべてに対応できるはずです。この場合、扱える範囲が広くなるので、有用性はずっと高くなります。ただし、SACも含め、現在の強化学習アルゴリズムにそこまでの能力があるのか、と感じます。疑問：存在しないエンティティの取り扱い実装した Mission 4 や、上記のように各プランを統一的に取り扱う場合、存在しないエンティティ（最初から存在しなかったり、途中で撃破されて存在しなくなったりしたエンティティ）を取り扱う必要があります。今回は、存在しなくなった段階で。観測量をすべて 0 にすることで対応しました。結果的には問題はありませんでしたが、実態とは違った取り扱いになっているので、もっと良い方法はないのだろうか、と思います。感想：強化学習によるプランニングの将来性今回のようなプランニングを、現実問題でどう使うのかについては、ランド研究所のレポートでは何も述べられていません。これについては、University College of London のグループが行った、複数（数隻）USV（Unmanned Surface Vehicle）のプランニング研究が参考になると思います。具体的には、下図のような３階層アーキテクチャで、USV のプランニングからコントロールまでを行うシステムが提案されています。 Path planning algorithm for unmanned surface vehicle formations in a practical maritime environment 感想：拡張性ランド研究所のレポートの結論でも述べられてましたが、この方法では、あらかじめ設定したエンティティ数以上のエンティティには対応できません。このためレポートでは、戦場をグリッド化して対応する案が提案されています。この場合、扱える敵のエンティティ数は任意にできるのですが、味方のエンティティ数はやはりあらかじめ最大値を決めておく必要があると思われます。この制約を取り払うには、例えば、各エンティティを自律エージェントとみなして、マルチエージェント強化学習を適用することが考えられます。ただし、マルチエージェント強化学習は、学習が強化学習よりもさらに困難で Long way to go なレベルです。感想：自律分散システム（Autonomous）というアプローチ今回のアプローチは、AlphaStar 等と同じく、中央集権的なプランニングでした。これとは別のアプローチとして、Hide & Seek 等のように、自律エージェントによる分散自律的なアプローチが考えられます。上記のマルチエージェント強化学習はその一例です。実際に戦闘を行う現場の箱物の視点からは、自律システムの方が有用だと考えられます。一方、C4I（Command, Control, Communication, Computer and Intelligence, 指揮統制系）という視点からは、今回のようなアプローチも有用だと思います。現実問題としては、この2つの両極にあるアプローチの中間点が取られることになるものと想像できますが、今後どこでどうバランスがとられた全体システムの研究につながっていくのか楽しみです。感想：実世界の問題に強化学習は使えるのだろうか？今回の問題設定は、実際の問題を極限までシンプルにした設定です。にもかかわらず、（少なくとも、私のビンテージマシンでは）、数日の学習が必要でした。囲碁やAtariのゲームも現実世界の問題に比べると極めてシンプルです。 DeepMind, OpenAI, UC Berkeleyといった先端研究機関の研究でも、現実世界の問題は未だ遥か彼方な感じがします。かなりのBreak through が無い限り、現実世界の問題に対して使うのはなかなか難しいのではないかという気がします。或いは、深層強化学習も、かつての Optimal Control や Robust Control と同じような道をたどるのでしょうか？反省：巨大化するCodeの取り扱い必要なものをその都度追加していったので、いつの間にかコードが巨大化してしまいました。やはり、モジュールに分割して作った方が、デバッグが楽です。追記：別の題材で、マルチエージェント強化学習の応用を取り扱った記事を書き始めました。マルチエージェント強化学習を使って、複数群vs複数群のための協調戦闘戦術を生成してみる過去記事へのリンクランド研究所の「機械学習による航空支配」を実装する（その1）：レポートのまとめランド研究所の「機械学習による航空支配」を実装する（その2）：1次元問題についてランド研究所の「機械学習による航空支配」を実装する（その3）： 1D simulator for GAN と Random mission planner の実装）ランド研究所の「機械学習による航空支配」を実装する（その4）： conditional GAN の実装とトレーニングランド研究所の「機械学習による航空支配」を実装する（その5）：トレーニング結果の分析ランド研究所の「機械学習による航空支配」を実装する（その６）：トレーニング・データの重要性と GAN の性能向上ランド研究所の「機械学習による航空支配」を実装する（その７）：1D simulator for RL の実装ランド研究所の「機械学習による航空支配」を実装する（その８）： Stable Baselines による強化学習ランド研究所の「機械学習による航空支配」を実装する（その９）：少し複雑な環境ランド研究所の「機械学習による航空支配」を実装する（その１０）：GAN / 強化学習プランナーの連携を考えるランド研究所の「機械学習による航空支配」を実装する（その１１）：２次元問題の概要ランド研究所の「機械学習による航空支配」を実装する（その１２）： 2D simulator for mission_1 の実装ランド研究所の「機械学習による航空支配」を実装する（その１３）： 2D 問題 mission_1 を強化学習するランド研究所の「機械学習による航空支配」を実装する（その１４）： Relative Observation による mission planner の能力アップランド研究所の「機械学習による航空支配」を実装する（その１５）： 2D問題 mission_2 ランド研究所の「機械学習による航空支配」を実装する（その１６）： 2D問題 mission_3 ランド研究所の「機械学習による航空支配」を実装する（その１７）： 2D問題 mission_4 ランド研究所の「機械学習による航空支配」を実装する（その１８）： 2D問題 mission_4 Reward shaping による改良

　 Tweet
Qiitaで続きを読む

20210910のTensorFlowに関する記事は3件です。

M1 Mac + Dockerの環境でTensorflowを使う

M1 Mac + Dockerの環境でTensorflowをビルドする

ランド研究所の「機械学習による航空支配」を実装する（その１９）：最後に

日付別

タグ一覧