
Video-based Human Tracking Robust to Dynamic Camera Position and Orientation Changes
スマートグラスの可視領域情報を用いた不連続動画上の人物追跡
近年,Augmented Reality(AR)グラスやスマートグラスが備えるRGBカメラや深度カメラを用いて現実空間の人やモノを認識が行われている.それらに関するサイバー情報を現実空間映像やグラスに重畳して表示する様々なアプリケーションが提案されている.例えばスポーツ分野では,カメラによって試合やトレーニング中の選手を検出・識別し,スマートグラスを装着する観客やコーチに対してそれらのデバイスを通して選手情報を提供するシステムも提案されている.このようなスマートグラス用アプリケーションの実現のためには,カメラが捉えた映像中の人の追跡が不可欠である.
映像中の物体追跡手法は数多く提案されている.例えばDeepSORTは,物体検出手法Yoloを用いて画像内の対象オブジェクトを検出し,2次元画像フレーム内での移動を想定したカルマンフィルタを用いて連続フレーム間で対象物体の追跡を実現する.しかしDeepSORTを含め,既存の映像中の人物追跡手法は定点観測映像を想定しているものが多い.実際,カメラの位置や向きが変化する状況では,数フレーム以上に渡る遮蔽(オクルージョン)や追跡対象の画像フレーム内,あるいはフレーム内外での想定以上の移動が頻繁に発生する.そのため安定的な移動を想定しているカルマンフィルタでは追跡精度が大幅に低下するといった課題がある.
本研究では,定点観測映像の既存の複数人物追跡(MOT)手法に対し,映像内で新たに検出された人物が過去に追跡されていた人物かどうかを判定する手法を提案する.過去に検出された人物であればどの人物かを識別する人物再識別(Re-ID)を適切に適用することで,スマートグラスが捉える可変視点の動画像に出現する人物を継続的に追跡する.また一度検出した人物は,最後に映像から消失した位置と時刻からその存在位置を推定し続ける.そしてスマートグラスの視線方向および位置を元に,現在の視野内にその人物が含まれるかを推定することで,明らかに存在し得ない人物を再識別対象とすることを抑制する.これにより人物再識別精度の向上を図る.

発表論文
- 高橋直也, 天野辰哉, 山口弘純, & 東野輝夫. (2021). 深層距離学習を用いた AR デバイス向けの人物識別手法. マルチメディア, 分散協調とモバイルシンポジウム 2021 論文集, 2021(1), 388-394.
- 高橋直也, 天野辰哉, & 山口弘純. (2021). スマートグラスの可視領域情報を用いた不連続動画上の人物追跡. 研究報告モバイルコンピューティングと新社会システム (MBL), 2021(29), 1-8.
- Takahashi, N., Amano, T., & Yamaguchi, H. (2023, June). Multi-Person Tracking Method Robust to Dynamic Viewport Changes for AR apps. In 2023 19th International Conference on Intelligent Environments (IE) (pp. 1-4). IEEE.
Other Research Topics
鉄道駅プラットフォームにおけるデジタルツインを用いた群衆流モデリング
鉄道駅プラットフォームにおける効果的な群衆追跡は,乗客の安全確保と歩行者流の最適化に不可欠です.特に高密度な都市交通ハブでは,従来の物体検出やマルチオブジェクトトラッキング手法は,深刻なオクルージョンや人物の重なりにより限界があります.本研...
移動ログにおける時空間・自然言語データの効率的な機械学習消去
現代のモビリティプラットフォームは,GPS軌跡,時間メタデータ,自由形式のテキストノートなど,膨大なデータを蓄積しています.GDPRなどのプライバシー法規では,個人のデータをオンデマンドで消去(アンラーニング)することが求められますが,削除...

言語モデルを活用した適応型メッセージスケジューリング
この研究では、次世代の世界気象IoTデータ交換システムである WMO情報システム2.0(WIS2.0) のブローカーにおいて、システム内のサブスクライバーが要求するメッセージの時間制約(デッドライン)を満たすための適応型メッセージ配信メカニ...

WiFi RSSI統合型視覚言語モデルによる屋内物体認識
本研究は、視覚言語モデル(Visual-Language Model, VLM) を活用し、屋内環境における物体の自動識別および分類を行う新しい手法を提案する。従来の手法では、各物体を手動でラベリングするコストの高さや、記述の曖昧さが課題と...

三次元点群からの形状特徴に基づく被災者判定
日本では毎年多くの災害が発生しており,大規模地震の発生も頻繁です.特に,阪神淡路大震災の事例からも分かるように,被災者の発見が遅れると生存率が大幅に低下するため,迅速な捜索活動が求められています.ドローンは柔軟な捜索が可能であることから,近...

機械学習による道路ネットワークを考慮した低粒度GPS軌跡データの復元手法
プライバシー保護とデータ有用性のバランスを考慮し、切り捨てられた低解像度のGPS軌跡データを高解像度に復元する新たなシステムを提案する。本システムは、Transformerとグラフ畳み込みネットワーク(GCN)を統合し、軌跡データの時系列依...