車いすバスケットボールにおける単眼カメラによる選手位置情報を用いた行動認識

Localization Focusing on Human Poses Using a Single Camera Towards Social Distance Monitoring During Sports

車いすバスケットボールにおける単眼カメラによる選手位置情報を用いた行動認識

車椅子バスケットボール行動認識スポーツセンシング

近年、スポーツにおけるデータ分析が盛んになっており、特に試合中のプレーを認識することは戦術構築をする上で重要な役割を果たします。例えば、どこからシュートを打ってどれくらい成功したかといった画像のようなシュートチャートが得られると、どの方向から相手をブロックすべきかが変わります。しかし、分析のためには日々の練習や試合のデータを収集し続けることが重要であり、ここでラベリングの手間が問題になります。したがってラベリング自動化のために、本研究では試合中のアクション認識を行うことを目指します。

選手の行動判断の材料には選手の位置や方向,移動の速度といったコートを中心とした動きが含まれると考え、この位置情報を考慮した行動認識モデルの設計を行います。

例えば、バスケットボールにおいてボールを保持しているとき、その選手が自陣にいるか、ハーフライン付近にいるか、ゴールの下にいるかでは、行動の優先順位が大きく変わると考えられます。ゴールから遠くなるほど、パスやドリブルの優先順位が上がり、シュートの選択はされにくいと考えられます。映像データを入力として、まず位置推定を行い位置特徴量の抽出を行います。
次に、位置推定と並行して既存の行動認識モデルを用いて人物中心の動きを認識します。人物中心の動きを認識するため、これをジェスチャー認識モデルとしてわれわれは考えます。最後にこれらの出力を合わせて分類器にかけ最終的なクラスの出力を行います。

関連論文

鉄道駅プラットフォームにおけるデジタルツインを用いた群衆流モデリング

鉄道駅プラットフォームにおける効果的な群衆追跡は,乗客の安全確保と歩行者流の最適化に不可欠です.特に高密度な都市交通ハブでは,従来の物体検出やマルチオブジェクトトラッキング手法は,深刻なオクルージョンや人物の重なりにより限界があります.本研...

デジタルツイン 群衆シミュレーション 鉄道駅

移動ログにおける時空間・自然言語データの効率的な機械学習消去

現代のモビリティプラットフォームは,GPS軌跡,時間メタデータ,自由形式のテキストノートなど,膨大なデータを蓄積しています.GDPRなどのプライバシー法規では,個人のデータをオンデマンドで消去(アンラーニング)することが求められますが,削除...

機械学習消去 プライバシー モビリティ
言語モデルを活用した適応型メッセージスケジューリング 大阪大学 山口研

言語モデルを活用した適応型メッセージスケジューリング

この研究では、次世代の世界気象IoTデータ交換システムである WMO情報システム2.0(WIS2.0) のブローカーにおいて、システム内のサブスクライバーが要求するメッセージの時間制約(デッドライン)を満たすための適応型メッセージ配信メカニ...

WIS2.0 Pub/Sub 強化学習
WiFi RSSI統合型視覚言語モデルによる屋内物体認識 大阪大学 山口研

WiFi RSSI統合型視覚言語モデルによる屋内物体認識

本研究は、視覚言語モデル(Visual-Language Model, VLM) を活用し、屋内環境における物体の自動識別および分類を行う新しい手法を提案する。従来の手法では、各物体を手動でラベリングするコストの高さや、記述の曖昧さが課題と...

点群 Visual Language Model AIoT +3
三次元点群からの形状特徴に基づく被災者判定 大阪大学 山口研

三次元点群からの形状特徴に基づく被災者判定

日本では毎年多くの災害が発生しており,大規模地震の発生も頻繁です.特に,阪神淡路大震災の事例からも分かるように,被災者の発見が遅れると生存率が大幅に低下するため,迅速な捜索活動が求められています.ドローンは柔軟な捜索が可能であることから,近...

ドローン LiDAR 被災者検知
機械学習による道路ネットワークを考慮した低粒度GPS軌跡データの復元手法 大阪大学 山口研

機械学習による道路ネットワークを考慮した低粒度GPS軌跡データの復元手法

プライバシー保護とデータ有用性のバランスを考慮し、切り捨てられた低解像度のGPS軌跡データを高解像度に復元する新たなシステムを提案する。本システムは、Transformerとグラフ畳み込みネットワーク(GCN)を統合し、軌跡データの時系列依...

GPS復元 時空間データ Transformer +4