高速で正確なFamiliar Face Identificationは、シームレスな利便性と各世帯員に合わせたパーソナライズされた体験を提供することで、スマート・ホームを強化します。このテクノロジーは、顔見知りと見知らぬ人の顔を瞬時に認識し、個人の好みに応じたホーム設定の自動調整を可能にします。Familiar Face Identificationは、生体認証データをローカルで保護し、メンテナンスを最小限に抑えることで、日常の相互作用をより直感的でパーソナライズされたものにします。
embedUR社は、組み込みAIとSTM32N6マイクロコントローラを組み合わせることで、これらの課題に取り組んでいます。同社のソリューションは、顔認識パイプライン全体をデバイス上に直接デプロイし、それによってクラウドへの依存と外部ハードウェア・アクセラレータの必要性を排除します。登録は、モバイル・コンパニオン・アプリを通じて近代化されており、迅速なオンボーディングと、組み込みスマート・ロックへの顔データのシームレスかつセキュアな送信が可能です。すべての照合と管理はローカルで実行され、瞬時のアクセスと確実な保護を実現します。
アプリケーション・ドメイン
- パーソナライズされたスマート照明および空調制御
- カスタマイズされたマルチメディア / エンターテインメント設定
- スマート・キッチンやスマート家電のパーソナライズ
- ヘルス & ウェルネス・モニタリングおよび支援
- 各世帯員に合わせた通知やリマインダ
アプローチ
従来の個人識別システムは長年、クラウド・ベースの認識、RFIDまたはキーパッド入力、外部ハードウェア・アクセラレータによる顔認識に依存していました。これらのアプローチは基本的な機能を提供するものの、いずれもユーザ体験、セキュリティ、運用効率に影響する固有の制限があります。
従来のソリューションの限界から、STM32マイコン上で直接実行される<72>軽量の顔識別モデルを使用した新しいアプローチが考案</72>されました。このイノベーションにより、クラウド・サービスや外部アクセラレータに依存することなく、プライバシー優先のリアルタイム生体認証が可能になります。モバイル・アプリ・コンパニオンはユーザのオンボーディングを近代化し、直感的な顔登録と組み込みデバイスへの生体特徴のセキュアな送信を実現します。
STM32組み込みAIソリューションの主なメリット:
- 完全なオンデバイス推論:クラウドへの依存を排除し、プライバシー・リスク、遅延、運用コストを削減
- スムーズなユーザ体験:モバイル・アプリにより即時のフィードバックで登録プロセスを簡素化
- 低消費電力かつ小型:スペース制約のあるバッテリ駆動デバイスへの統合が可能
- 高速応答:約70ミリ秒以内に認証を実行
アプリケーションの概要
カメラから画像をキャプチャし、顔を検出して検証し、埋め込みを抽出し、既存のレコードと照合するか、新しいエントリとして登録するリアルタイム顔認識システム。パイプラインは、厳格な品質チェックと効率的な顔照合ロジックによって信頼性を重視しています。
1.画像取得
カメラから解像度が224 x 224 x 3のRGB画像をキャプチャします。
2.顔検出
YOLOv8ベースのモデルで画像内の顔を識別し、バウンディング・ボックスと顔のキーポイントを出力します。あらかじめ設定されたしきい値に基づいて低信頼度の検出を除外し、非極大値抑制(NMS)を適用して重複を削除し、最も可能性の高い検出を保持します。
3.品質評価
検出された顔が認識に適していることを確認するために、複数の検証チェックを実行します。
- キーポイント信頼度:検出された顔ランドマークの信頼性を検証します。
- 鼻の位置:鼻が予想される境界内にある(つまり、正面ポーズである)ことを確認します。
- 頭の傾き:垂直方向に傾きすぎた顔を拒否します。
- 距離チェック:顔のサイズに基づいて、顔がカメラから近すぎたり遠すぎたりしていないことを確認します。
上記の条件をすべて満たした顔だけが次のステージに進みます。
4.顔の前処理
有効な顔をクロップし、サイズ変更し、正しい方向にそろえます。追加の傾斜角チェックを実行して、過剰に回転した顔を破棄します。前処理した顔を認識のために転送します。
5.特徴抽出
整列した顔をArcFaceベースのモデルに通して、個人を一意に表す512次元の特徴埋め込みを生成します。
6.ID照合
生成した埋め込みを保存されている埋め込みデータベースと比較してIDを決定します。
一致あり:
- 類似度スコアがしきい値を超え、IDが既知である場合は、名前を表示します。
- IDが不明の場合、ユーザに名前の割り当てを要求します。
一致なし(高品質の顔):
- 一致するものがないが、顔の品質が十分である場合、名前未設定の新しいエントリとしてデータベースに追加します。
センサ
MB1854Bカメラ・モジュールは、CMOSイメージ・センサIMX335を搭載し、鮮明で高精細のRGB画像をキャプチャした高解像度画像を提供します。IMX335は、リアルタイムの顔検出や顔認識などのコンピュータ・ビジョン・タスクに最適です。低照度性能と画像の鮮明さにより、さまざまな照明条件で鮮明なデータを確実にキャプチャできます。センサにより、顔認識システムの入力として機能するRGBフレームを生成します。
データセットとモデル
モデル:
- embedUR社独自の顔認識およびキーポイント、入力サイズ:224 x 224 x 3
- embedUR社独自の顔埋め込みモデル、入力サイズ:112 x 112 x 3
結果
推論時間:約100ms/フレーム
フレーム・レート:10fps
SRAM:1MB
PSRAM:3MB
執筆者:Sai Rajesh(embedUR社)| 最終更新日:2025年10月
リソース
STM32Cube.AIで最適化
STM32Cubeの無料の拡張パッケージX-CUBE-AIを使用すると、ニューラル・ネットワークや機械学習モデルなどの学習済みAIアルゴリズムを、STM32用の最適化されたCコードに自動変換できます。
STM32N6シリーズに最適
Arm® Cortex®‑Mプロセッサをベースとする32bit汎用マイクロコントローラのSTM32ファミリは、より柔軟かつ自由なアプリケーション開発を実現します。高性能、リアルタイムの処理能力、デジタル信号処理(DSP)、低消費電力 / 低電圧動作、コネクティビティなどのさまざまな機能を集積した製品により、開発をサポートします。