20210411のTensorFlowに関する記事は2件です。

投稿日：2021-04-11T21:30:19+09:00

PythonとAnacondaとTensorflowでGPU環境を整える

メモ書きです．色々調べて最新版入れればいいだろと思って https://www.tensorflow.org/install/source_windows?hl=ja ここから対応表見てPython3.8とTensorflow-gpu ver2.3でやって見たのですがうまく行かず･･･どうも，TensorflowにはGPU用のビルドがあるらしく https://medium.com/lsc-psd/tensorflow2-1%E3%81%A7cuda10-1%E3%81%AA%E3%81%AE%E3%81%ABgpu%E3%81%8C%E8%AA%8D%E8%AD%98%E3%81%95%E3%82%8C%E3%81%AA%E3%81%84%E5%95%8F%E9%A1%8C%E3%81%AE%E8%A7%A3%E6%B1%BA%E6%B3%95-6be5137ec216 現在2021年4月11日時点ではTensorflow 2.3をAnacondaのGUIからダウンロードするとmklビルド（CPU用のビルドらしい）が当たるらしく，それでうまく行かなかったようです．それぞれのバージョンをPython3.7とTensorflow_gpu-2.1.0まで落としてするとAnacondaのGUIからのインストールでもGPU用のビルドが適用され何事もなくGPU認識となりました．あとがき自前でビルドしてしまえば関係ないかもしれないですね．あくまでAnacondaを利用した場合の話です．使用したバージョン tensorflow_gpu 2.1.0 (AnacondaのGUIより） Python 3.7　（AnacondaのGUIより） MSVC 2019　（参考資料[2]より） cuDNN 7.6　（参考資料[3]より） CUDA 10.1　（参考資料[4]より）システム環境変数のPathに[5]に示してあるようなフォルダのパスを追加すること．（エクスプローラから直接確認コピペすること）参考資料 [1] https://qiita.com/nemutas/items/c7d9cca91a7e1bd404b6 [2] https://www.kkaneko.jp/tools/win/buildtool.html#S1 [3] https://developer.nvidia.com/rdp/cudnn-archive [4] https://developer.nvidia.com/cuda-10.1-download-archive-base?target_os=Windows&target_arch=x86_64&target_version=10 [5] https://www.tensorflow.org/install/source_windows?hl=ja

　 Tweet
Qiitaで続きを読む

投稿日：2021-04-11T20:19:05+09:00

Tensorflowによるカテゴリー分類の、CSVデータのデータセットの作り方

はじめに　こんにちは、新しい技術が大好きなsazanami5です。qiita初投稿ですのでお手柔らかにお願いします。ご意見、ご指摘等ありましたらぜひコメントいただけると嬉しいです。　流行りの深層学習に興味を持ち、「深層学習の教科書」という本を読んでからtensorflowで時々遊んでいます。最近、TensorFlowを使ってカテゴリー分類の機械学習を自前のCSVデータで動かしたのですが、データセットがうまく作れず、少し苦戦してしまいました。データセットを作る方法をまとめた記事があまりなく、TensorFlowチュートリアルも少し読みにくかったため、今回データセットの作り方を中心に投稿させていただくことにしました。よくあるアヤメの分類のようなカテゴリー分類のためのデータセットを作っています。環境私はローカルの仮想環境で実行していますが、Google Colaboratoryを利用すれば環境構築の必要はありません。 python 3.8.6 tensorflow 2.4.1 numpy 1.19.5 pandas1.2.1 matplotlib 3.3.3 使用するCSVデータこのデータは第二外国語を学習したことのある人を対象に行ったものです。学習したことのある第二外国語（その他を含む8言語の中から選択）を最初に聞き、Q1~Q30では日常や生活習慣などに関する二択の質問を行っています。質問の内容とラベルの内容が知りたい方は左の▶︎を押してくださいみづらくてゴメンなさいそれぞれの回答を数字に変換したデータは以下のようになっています。 language Q1 Q2 Q3 ... Q30 0 0 1 0 ... 1 1 0 0 0 ... 0 2 1 0 0 ... 1 6 0 0 0 ... 1 4 1 0 0 ... 1 2 1 0 0 ... 0 ... ... ... ... ... ... 2 1 0 0 ... 1 データセットを作るついに本題のデータセットの作り方について説明します。上で用意したcsvデータを、分類するラベル（languageのカラム）と学習させるデータ（languageカラム以外の列）に分ける必要があります。 pandas等を使ってコードでも出来るのですが、今回はExcelを使い、以下の4つのファイルを作成しました。訓練用データ（データの7割） x_train.csv（languageカラム以外の列） y_train.csv（languageカラムの列）評価用データ(データの3割) x_eval.csv（languageカラム以外の列） y_eval.csv（languageカラムの列）ライブラリのインポート必要なライブラリをインポートします。データ処理は私が慣れているPandasを利用しました。 secondLanguageRecommend.ipynb import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Activation from tensorflow.keras.optimizers import Adam import numpy as np import pandas as pd 変数のセット secondLanguageRecommend.ipynb tf.random.set_seed(0) #再現性を持たせるためにランダムの値を固定する num_classes = 8 #ラベルの種類が8つ batch_size = 5 epochs = 20 CSVデータの読み込み pd.read_csvを使って読み込みます。windowsやmacのどちらのデータでも使えるようにするため、念の為エンコードをutf-8に指定しています。データ構造 secondLanguageRecommend ├ secondLanguageRecommend.ipynb └ data/ ├ x_train.csv ├ x_eval.csv ├ y_train.csv └ y_eval.csv secondLanguageRecommend.ipynb #データの読み込み x_train = pd.read_csv("data/x_train.csv", encoding= "utf-8") x_test = pd.read_csv("data/x_eval.csv", encoding= "utf-8") y_train = pd.read_csv("data/y_train.csv", encoding= "utf-8") y_test = pd.read_csv("data/y_eval.csv", encoding= "utf-8") #一行目のカラムの行を取り除き、数値部分のみにする x_train = x_train.values x_test = x_test.values y_train = y_train.loc[:,"language"] y_test = y_test.loc[:,"language"] print(x_train[:10]) print(type(x_train)) 出力 out [[0 1 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 1 1 0 1 0 1 1] [0 0 0 0 0 0 1 1 0 0 0 0 1 1 1 1 1 1 0 0 1 0 0 0 1 1 0 1 1 0] [1 0 0 1 0 1 0 0 0 0 0 0 0 1 1 1 1 1 0 1 1 0 1 1 1 0 1 0 0 1] [0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 1 1 0 0 0 1 0 1 0 1 0 1 1] [1 0 0 1 0 0 1 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 1 0 0 1 0 0 1 1] [1 0 0 1 0 1 0 0 1 0 1 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 0 1] [0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 1 1 1 1 0 1 1 0 0 0 0 1 1 1 0] [0 0 0 0 0 1 1 0 1 1 0 1 0 1 0 1 1 0 0 0 1 0 0 1 1 0 0 0 0 1] [0 0 0 0 0 1 1 1 0 0 0 0 1 0 0 1 1 1 0 1 1 0 1 0 0 1 0 0 1 0] [0 1 0 1 0 0 1 1 1 1 1 0 0 1 1 0 1 1 1 0 0 1 1 1 0 1 0 0 1 1]] <class 'numpy.ndarray'> ここで型がnumpy.ndarrayになっていることが大事です。自分はここでDataFrameやlistではできないことを知らなくてつまずきました。ぴえん。全ての列のデータを取りたい時は.values、特定の列のデータを取りたい時は.loc[:,"カラム名１","カラム名２"]を使ってください。ラベルをone-hotベクトルにする one-hotベクトルとは One-hot ベクトルとは、(0,1,0,0,0,0) のように、1つの成分が1で残りの成分が全て0であるようなベクトルのことです。引用元:算数から高度な数学まで、網羅的に解説したサイト今回は0〜７の8個のカテゴリーがあるので、[[0][4][3]]のようなデータを[[1,0,0,0,0,0,0,0][0,0,0,0,1,0,0,0][0,0,0,1,0,0,0,0]]にするということです。 kerasにあるto_categorical関数を使って変換します。 keras公式ドキュメント secondLanguageRecommend.ipynb # convert class vectors to binary class matrices y_train = tf.keras.utils.to_categorical(y_train, num_classes) y_test = tf.keras.utils.to_categorical(y_test, num_classes) print(y_train[:10]) print(type(y_train)) 出力 out [[0. 1. 0. 0. 0. 0. 0. 0.] [0. 0. 1. 0. 0. 0. 0. 0.] [1. 0. 0. 0. 0. 0. 0. 0.] [0. 0. 0. 1. 0. 0. 0. 0.] [1. 0. 0. 0. 0. 0. 0. 0.] [0. 0. 1. 0. 0. 0. 0. 0.] [0. 0. 0. 1. 0. 0. 0. 0.] [0. 0. 1. 0. 0. 0. 0. 0.] [0. 0. 1. 0. 0. 0. 0. 0.] [0. 0. 1. 0. 0. 0. 0. 0.]] <class 'numpy.ndarray'> 変換できました。これでデータセットは完成です。これをそのままfitの引数に渡すことで学習できます。まとめ型はnumpy.ndarray カテゴリー分類はone-hotベクトルに変換最後に　データセットの作り方は今回の方法の他にも様々なものがあり、どれが正解というものでもないと思います。一つの選択肢として誰かの役に立てば幸いです。また、今回のような０と１の回答だけではない場合は正規化という作業も必要ですので、時間があれば追記いたします。ここまで読んでいただきありがとうございました。最後に今回のコードを貼っておきます。 secondLanguageRecommend.ipynb import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Activation from tensorflow.keras.optimizers import Adam import numpy as np import pandas as pd tf.random.set_seed(0) num_classes= 8 batch_size= 5 epochs= 20 #load data x_train= pd.read_csv("data/x_train.csv", encoding= "utf-8") x_test= pd.read_csv("data/x_eval.csv", encoding= "utf-8") y_train= pd.read_csv("data/y_train.csv", encoding= "utf-8") y_test= pd.read_csv("data/y_eval.csv", encoding= "utf-8") y_train = y_train.loc[:,"language"] y_test = y_test.loc[:,"language"] x_train = x_train.values print(x_train[:10]) print(type(x_train)) # convert class vectors to binary class matrices y_train = tf.keras.utils.to_categorical(y_train, num_classes) y_test = tf.keras.utils.to_categorical(y_test, num_classes) print(y_train[:10]) print(type(y_train)) # モデル作成 model = Sequential() model.add(Dense(32, activation='relu', input_shape=(30,))) model.add(Dense(32, activation='relu')) model.add(Dense(num_classes, activation='softmax')) model.summary() model.compile(loss='categorical_crossentropy', optimizer="adam", metrics=['accuracy']) # モデルを学習 history = model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs, verbose=1, validation_data=(x_test, y_test)) # テストデータに対して誤差と精度を評価 score = model.evaluate(x_test, y_test, verbose=0) print('Test loss:', score[0]) print('Test accuracy:', score[1])

　 Tweet
Qiitaで続きを読む

20210411のTensorFlowに関する記事は2件です。

PythonとAnacondaとTensorflowでGPU環境を整える

Tensorflowによるカテゴリー分類の、CSVデータのデータセットの作り方

日付別

タグ一覧