アプローチ
エッジAIセンシング・キットの導入当初の目的は組み込みビジョン・インテリジェンスの能力を示すことで、デモのためのシナリオ第1号として果物の検出と計数が選ばれました。今回の使用用途は、正確なリアルタイム在庫管理が不可欠なスマート小売において、このテクノロジーの有効性を明確に示します。最初は食料品に注目したものの、基盤となるエッジAIビジョン・テクノロジーは、スマート・ホーム、スマート・シティ、在室監視、その他の状況認識オートメーション・システムなど幅広い分野に適用できます。
組み込みAIは、こうした枠組みを根底から変革します。インテリジェンスがデバイス上に直接実装されるのです。エッジでのリアルタイム処理は、外部インフラへの依存度を下げ、運用コストを削減するとともにスピードと効率を向上します。さらに、この分散型の手法は拡張性やセキュリティに優れるだけでなく導入への敷居が低く、幅広い業種でコンピュータ・ビジョンに基づくアプリケーションを現実味のあるものとします。
- エッジAIセンシング・プラットフォーム・ディスカバリ・キットでは、リアルタイムの物体検出と計数モデルのすべてをSTM32N6マイコン上で実行します。主なメリット:
- 在庫をリアルタイムで即座に可視化する、低遅延性能(通常、200ms未満)
- クラウド・サーバに依存しない完全なエッジ処理
- さまざまな照明や配置状態で複数の製品の種類を検出できるように学習したAIモデルによる正確性の向上
- 消費エネルギーの制約に抵触せずに連続監視を可能とする超低消費電力
- クラウド・サーバ、定期的なデータのコスト、タグ付けインフラの追加などを必要としない低運用コスト
アプリケーションの概要
5メガピクセルのカメラが高解像度の画像を取得し、それをイメージ・シグナル・プロセッサ(ISP)サブシステムが処理します。256 x 256にリサイズされた画像が、NPU(Neural-ARTアクセラレータ)に送られ、果物や手を検出します。バウンディング・ボックスの後処理により、果物を種類ごとに数え、果物に対する処置を検出します。イベントはイベント・コントローラによって管理され、タイムスタンプを付けて記録されます。これと並行して、ISPによって960 x 960の画像が生成され、これがH.264エンコーダによってビデオ・エンコーディングされたうえで、USBまたはWi-Fiを介してストリーム送信されます。リモート監視のためのテレメトリは、IoTコントローラが処理します。
センサ
この実物大模型に使われているセンサは、Sony IMX335 5MP RGBです。
- 入力:2592 x 1944
- IPSサイズ変換:960 x 960
- フレーム・レート:15FPS
アプリケーション固有の要件を満たせるように、E2IP社は各種センサを搭載したその他の拡張ボードを提供できます。
データセットとモデル
データセット:
- カスタム・データセット(7分類)
- オリジナル画像:8,000枚
- 拡張画像:115,000枚
- アノテーション:510,000
モデル:
- YOLOv8-nano
- 入力サイズ:256 x 256 x 3
- 学習可能パラメータ:3,031,321
- MACC:6.73E+08
結果
重みパラメータ(Flash):2.9MB
実行サイズ(RAM):880KB
推論時間:33ms
1秒あたりの推論回数:30
執筆:E2IP Technologies & Siana Systems | 最終更新:2025年5月
リソース
STM32Cube.AIで最適化
STM32Cubeの無料の拡張パッケージX-CUBE-AIを使用すると、ニューラル・ネットワークや機械学習モデルなどの学習済みAIアルゴリズムを、STM32用の最適化されたCコードに自動変換できます。
STM32N6シリーズに最適
Arm® Cortex®‑Mプロセッサをベースとする32bit汎用マイクロコントローラのSTM32ファミリは、より柔軟かつ自由なアプリケーション開発を実現します。高性能、リアルタイムの処理能力、デジタル信号処理(DSP)、低消費電力 / 低電圧動作、コネクティビティなどのさまざまな機能を集積した製品により、開発をサポートします。