M5Stack

HOME
M5Stack
複数のオブジェクトを認識できるkmodelファイルを作成する

2020年1月19日 / 最終更新日時 : 2020年1月21日もんごんた M5Stack

複数のオブジェクトを認識できるkmodelファイルを作成する

　前の記事M5StickVやUnitVで使えるkmodelファイルをローカル環境で作成する。とオリジナル金魚認識モデルの生成ーエッジAI活用への道 3ー(HomeMadeGarbage) を参考にして、オリジナルの認識モデルを作成することができます。ただし、２つ以上のオブジェクトを認識したい場合はもう少し手を加える必要があるので、忘れないように記事にしておきます。（2020/1現在の情報にて作成しました。）

　※　現在試行錯誤しながら作業しているので、間違ったやり方をしているかもしれません。後で内容を修正する場合もあります。その点はご了承ください。特に（★調査中）の項目は自信がありません。

　気づいた点ありましたらコメントやメールで教えていただけると助かります。m(_ _)m

　もくじ(Index)

M5Stack関連の目次へ戻る

環境について

使用した環境は下記の通りです。

Ubuntu 18.04.3(64bit) ※Windows10上のVMWareで実行
Miniconda 4.7.12

　※作業フォルダを~/workで説明していますが任意です。

必要なものを準備する。

深層学習ソフトとモデル変換ソフト

　認識モデルを作成するのに必要なソフトのインストールは M5StickVやUnitVで使えるkmodelファイルをローカル環境で作成する。を参照してください。

Miniconda
Yolo-digit-detector
Maix_Toolbox

もくじへ戻る(Back to Index)

学習用の画像データ

　jpgのデータをたくさん用意します。（私は100枚用意しました。）教師データの数が増えると認識率が上がりますが、事前準備が大変になり、深層学習の時間も長くなります。複数オブジェクトの場合は一緒に写っている画像も用意するといい感じがします。今回は「ついまる」をモデルにしてフォ郎(follow)、フォロ美(follome)の２つの認識モデルを作成します。

画像形式はJPG
背景は何でもいい。（というか、色々なものがあった方がいい？★調査中）
色々な角度から撮影する。
ファイル名は英数字で任意（★調査中）
一つのフォルダに入れておく。

もくじへ戻る(Back to Index)

アノテーションツール（labelImg）

あとは、アノテーション（annotation: 「あるデータに対してタグやメタデータと呼ばれる情報を付加すること」 )を行うためにlabelImgというソフトを利用します。（Linux版で説明します。）

インストールの手順

　下記のようにコマンドを実行して、GitHubからインストールします。

sudo apt install pyqt5-dev-tools
cd ~/work
git clone https://github.com/tzutalin/labelImg
cd labelImg
pip install -r requirements/requirements-linux-python3.txt
make qt5py3
python labelImg.py

※ makeが無いと言われた場合は「sudo apt install make」でmakeをインストールしてください。

起動

　pythonコマンドで実行します。

cd ~/work/labelImg
python labelImg.py

もくじへ戻る(Back to Index)

データの準備

datasetフォルダの作成

test_dataset(※datasetを入れるフォルダ。名前は任意）を作成してその配下に以下の4つフォルダを作成します。

images
annotations
images_validation
annotations_validation

images

　学習用の画像データを収納します。（JPG画像）

annotations

　imagesのメタデータを含んだXMLを収納します。（labelImgの保存先になります。)

images_validation,annotations_validation

　Validation（検証）用の画像データおよびメタデータのXMLを収納するフォルダです。Validationデータについては下記のQiita記事が分かりやすいです。

Qiita

なぜ教師あり学習でバリデーションセットとテストセットを分ける必要があるのか？ ...

https://qiita.com/QUANON/items/ae569961ea02b4468e23

どうも。最近 Coursera で機械学習のコースを受講している @QUANON です。# 概要教師あり学習のデータセットには、1. トレーニングセット (training set)1. バリデーションセット (vali...

imagesとimages_validationの画像数（★調査中）

　まだ、どのくらい用意すればいいのか分かっていません。（爆）images_validationフォルダを作成しない場合はimagesの画像データから8(train):2(validation)の割合で利用されるようです。(Twitterで@nnn112358氏に教えていただきました。)

もくじへ戻る(Back to Index)

ラベリング（アノテーション）作業

　labelImgを起動して、用意した画像全部にラベリングを行います。

OpenDirとChangeSaveDirを設定する。

　データの準備で作成したフォルダでOpenDirはimages、ChangeSaveDirはannotationsを指定します。（Validationの時はOpenDir:images_validation,ChangeSaveDir:annotations_validation)

Create RectBoxをクリックして四角で囲う

ラベルを付ける

　例ではフォ郎（follow)と記入してラベルを付けています。この画像にはフォロ美も写っているので、Create RectBoxを押してfollomeのラベルも付けます。

作業を繰り返す

　用意した画像データに対して一つ一つ、全部ラベルを作成します。（Validation用のデータも）

もくじへ戻る(Back to Index)

labelImgの作業を楽にする設定

Auto Save

　メニューから「View」→「Auto Save Mode」のチェックを入れると、「Next Image」や「Prev Image」を押したときに自動的に保存されるようになります。

predefined_classes.txtの編集

　あらかじめオブジェクト名を登録しておくと楽です。labelImg/data/predefined_classes.txtを編集すると項目が増えます。

もくじへ戻る(Back to Index)

Yolo-digit-detectorで行う作業

ソースの修正（★調査中）

　先日の記事 M5StickVやUnitVで使えるkmodelファイルをローカル環境で作成する。ではcommitを戻したので、最新版では直っているらしい複数オブジェクトのバグにハマりました。ただ、私の環境だと最新版は動かなかったので、とりあえずの修正をfit.pyに行いました。実行結果を利用するので一回そのまま実行する必要があります。

実行結果を確認する。

　ターミナルを遡ってdetection_layer_XX(XXは数字）の記述を見つけます。

fit.pyを修正する

　確認した「detection_layer_XX」を元にYolo-digit-detector/yolo/backend/utils/fit.pyを修正します。下記の２か所です。

もくじへ戻る(Back to Index)

configsにjsonファイルを作成する。

　~/work/Yolo-digit-detector/configs/test_dataset.jsonを作成します。（ファイル名は任意）

★パラメータはまだ良く分かっていません。最適なパラメータは自分自身で決める必要があります。学習回数や検証の回数を増やすとそれだけ時間がかかるようになります。

model:labels　　アノテーションした際のラベルを記入します。[“follow”,”follome”]
train:
- actual_epoch　　　　　全体の学習回数
- train_image_folder　　学習画像データのパス
- train_annot_folder　　学習アノテーションデータのパス
- train_times　　　　　　学習の回数
- valid_image_folder　　検証用の画像データのパス
- valid_times　　　　　　検証の回数

{
    "model" : {
        "architecture":         "MobileNet",
        "input_size":           224,
        "anchors":              [0.57273, 0.677385, 1.87446, 2.06253, 3.33843, 5.47434, 7.88282, 3.52778, 9.77052, 9.16828],
        "labels":               ["follow","follome"],
        "coord_scale" : 		1.0,
        "class_scale" : 		1.0,
        "object_scale" : 		5.0,
        "no_object_scale" : 	1.0
    },
    "pretrained" : {
        "full":   				""
    },
    "train" : {
        "actual_epoch":         70,
        "train_image_folder":   "/home/mongonta/work/test_dataset/images",
        "train_annot_folder":   "/home/mongonta/work/test_dataset/annotations",
        "train_times":          4,
        "valid_image_folder":   "/home/mongonta/work/test_dataset/images_valid",
        "valid_annot_folder":   "/home/mongonta/work/test_dataset/annotations_valid",
        "valid_times":          2,
        "batch_size":           4,
        "learning_rate":        1e-4,
        "saved_folder":   		"tsuimaru",
        "first_trainable_layer": "",
        "jitter":				true,
        "is_only_detect": 		false
    }
}

学習の開始

　データが揃ったので学習の開始をします。その後のkmodelへの変換等はこちらのリンクを参照してください。

もくじへ戻る(Back to Index)

boot.py（M5StickV）

　出来上がったmodel.kmodelを適当な名前に変更（tuimaru.kmodel）し、microSDカードに置いて下記のようにclassesとtaskを書き換えます。

import sensor,image,lcd
import KPU as kpu

lcd.init()
lcd.rotation(2)
sensor.reset()
sensor.set_pixformat(sensor.RGB565)
sensor.set_framesize(sensor.QVGA)
sensor.set_windowing((224, 224))
#sensor.set_vflip(1)
#sensor.set_hmirror(1)
sensor.run(1)
classes = ["follow","follome"]
task = kpu.load("/sd/tsuimaru.kmodel")
anchor = (0.57273, 0.677385, 1.87446, 2.06253, 3.33843, 5.47434, 7.88282, 3.52778, 9.77052, 9.16828)
a = kpu.init_yolo2(task, 0.3, 0.3, 5, anchor)
while(True):
    img = sensor.snapshot()
    code = kpu.run_yolo2(task, img)
    if code:
        for i in code:
            a=img.draw_rectangle(i.rect(),color = (0, 255, 0))
            a = img.draw_string(i.x(),i.y(), classes[i.classid()], color=(255,0,0), scale=3)
        a = lcd.display(img)
    else:
        a = lcd.display(img)
a = kpu.deinit(task)

もくじへ戻る(Back to Index)

動作している様子

　boot.pyとtuimaru.kmodelをルートに置いたmicroSDをM5StickVにセットすると動作します。

active_epoch=70
にしたんだけど40で止まってしまった😅
データがまだおかしいのかな_φ(･_･

フォ郞(follow)、フォロ美(followme)の認識率上がった(￣∀￣)

フォロ美は行けそうなのでとりあえずこれでやってみよう。 pic.twitter.com/mvq2llR7Kr
— 紅樹　タカオ (@mongonta555) January 19, 2020