2024/08/26

物体検出の仕組みとは？代表的な4つの手法と活用事例をくわしく解説

著者THE OWNER 編集部
フォロー

(画像=ArisSuwanmalee/stock.adobe.com)

物体検出のシステムは、医療現場や建築現場をはじめ、様々な場所で活用されており、いろいろな分野の業務効率化に役立っています。

物体検出とはどういった技術であり、今後はどのような進化を遂げるのでしょうか。本記事では、物体検出の仕組みや代表的な4つの手法、最新の活用事例などを紹介します。

物体検出とは

物体検出とは、画像や動画に映っている物体の「種類・位置・個数」を検出する技術です。近年では、AIの深層学習（ディープランニング）を使った手法が主流であり、高精度かつ自動的に物体検出をするシステムも登場しています。

例としては、医療で用いられるCT画像から特定部位を検出するシステムが挙げられます。従来は医師が目視でCT画像を確認していましたが、今ではAIが癌などの異常部位をすばやく特定し、ヒトの診断をサポートするようになりました。

他にも自動運転や交通量の計測、セキュリティカメラなど、すでに物体検出は様々な業界で活用されています。

物体検出の仕組み

物体検出の手法はいくつかありますが、AIの深層学習を使ったシステムでは、以下の2ステップで被写体の要素を特定します。

対象物体の位置を絞り込む
対象物体の種類や個数を特定する

一般的に、位置の絞り込みでは対象物体となりそうな被写体をAIが見つけて、「バウンディングボックス」と呼ばれる長方形の枠で囲います。その後、バウンディングボックスごとに画像認識を行う流れで被写体の種類・位置・個数を特定します。

画像や動画によって被写体の数が異なる場合は、より複雑なシステムが必要になることもあります。また、被写体が多いケースでは、画像認識の精度やスピードが落ちるため、高速処理をするための技術について日々研究が進められています。

物体認識との違い

物体認識とは、被写体の種類を特定する技術です。画像や動画に「なにが映っているか」は特定できますが、位置や個数までは検出しません。

例えば、建設現場にシステムを導入した場合、物体認識でわかる要素は「ヒトが映っていること」「重機が映っていること」になります。位置、個数といったその他の要素解析までは行いません。

一方で、物体検出は種類・位置・個数を特定するため、「どこになにが、どれくらい映っているか」までわかります。仮に建設現場に導入した場合は、「ヒトが画像右上に3人映っている」や「2台の重機が画像の右下に並んでいる」などを検出できます。

革新的なAI開発を行うCACのR&D本部の詳細はこちら＞＞

物体検出の代表的な4つの手法

近年の物体検出では、AIによる深層学習が活用されています。アルゴリズムにも様々な種類があります。

ここからは、物体検出に使われる代表的な4つの手法を紹介します。

1.R-CNN

2013年に登場したR-CNN（Regional CNN）は、物体検出に深層学習をとり入れるきっかけとなった手法です。従来の検出モデルをディープランニング用のモデル（畳み込みニューラルネットワーク）に置き換えることで、深層学習による物体検出が可能になりました。

R-CNNでは、前述のバウンディングボックスの候補を2,000個ほど抽出し、抽出したデータごとに特徴量が計算されます。しかし、AIの学習時間やメモリの消費量が膨大であったため、処理方法を高速化する手法について研究が続けられてきました。

例えば、2015年に考案された「Fast R-CNN」では、領域提案と物体検出を同時に処理する仕組みが採用されています。他にも「Faster R-CNN」や「Mask R-CNN」などの派生システムが考案されており、今でもR-CNNはシステム開発の基礎になっています。

2.YOLO

YOLO（You Only Look Once）は、データ全体を等間隔のグリッドに分割し、領域ごとに物体の要素を分析する手法です。約2,000個のバウンディングボックス候補を構築するR-CNNとは違い、領域を小分けにして種類・位置・個数を検出するため、処理速度が速いという特徴をもっています。

YOLOの導入例としては、スマートフォン用のカメラアプリが挙げられます。リアルタイムに近い物体検出が可能なので、例えばカメラに映っている被写体（ヒトの顔やペット、飲食物など）を確認した上で、写真撮影ができるアプリなどに使用されています。

YOLOは背景の誤検出も抑えやすい手法ですが、被写体が多く映りこんでいる場合は、精度が下がりやすい傾向にあります。

3.SSD

SSD（Single Shot MultiBox Detector）は、物体のサイズや形などからバウンディングボックス候補を検出する手法です。YOLOのように等間隔ではなく、物体の特徴量に合わせてバウンディングボックスを生成し、高精度と高速処理を両立した仕組みになっています。

SSDの強みは、低画質のデータや小さな物体でも検出できる点にあります。また、バウンディングボックスの数も抑えられるため、R-CNNとYOLOの強みを掛け合わせた手法ともいえるでしょう。

4.DETR

DETR（End-to-End Object Detection with Transformers）は、自然言語処理に使われる「Transformer（※）」を初めて採用した物体検出の手法です。シンプルな構造でありながら、被写体によってはYOLOなどと同程度の精度を実現できるため、様々な分野への活用が期待されています。

（※）OpenAIのChatGPTやGoogleのBirdなど、対話型の生成AIにも使われている深層学習モデル。

DETRは研究段階の技術であり、小さな物体の検出精度は低い傾向があります。ただし、R-CNNのように派生システムの開発が進めば、シンプルかつ高精度な技術が確立される可能性があります。

物体検出の活用事例

物体検出の技術は、実際にどのような現場で活用されているのでしょうか。以下では最近の国内事例を紹介します。

建設現場の安全性向上を実現／東洋建設株式会社

東洋建設は、株式会社GAUSS、沖電気工業株式会社と協働し、魚眼カメラの映像と物体検出の技術を組み合わせて、広域俯瞰映像の物体検出ができるシステムを構築しています。

同社はクラウド上にAI学習用のプラットフォームを構築し、4台の魚眼カメラによる撮影データを短時間で解析できるようにしました。本システムの導入によって、自由な視点から周囲360度の映像データを取得し、スムーズに物体検出までできる環境を整えられます。

建築現場に本システムを導入することで、従来よりも広範囲の作業員を検知でき、安全性の向上を実現しやすくしています。

参考：東洋建設「フライングビュー映像から効率的・経済的にＡＩモデルを作成～物体検知システムの早期導入により現場の安全性向上を実現～」

ロボットカー向け物体検出ツール／株式会社ZMP

ロボットベンチャーの先駆者であるZMPは、AI技術開発用のロボットカー「RoboCar 1/10X」で物体検出ツールを提供しています。

物体検出ツールはソフトウェア開発環境（SDK）として搭載されており、ロボットカーを走らせながら映像データ取得し、リアルタイムで物体検出を行うことができます。指定した対象物をAI学習させることが可能であり、例えば前方にある車両や障害物を回避するアルゴリズムを構築するといった、安全な自動運転の研究開発で利用することができます。

参考：ZMP「自動運転/AI技術開発用ロボットカー RoboCarⓇ 1/10X ディープラーニングによるリアルタイム物体検出ツール提供開始」

海洋環境のモニタリング／国立研究開発法人産業技術総合研究所

産業技術総合研究所は、物体検出を活用した懸濁粒子（水中に浮かぶ、水に溶けないもの）の観測手法を考案しました。

海底の掘削作業などによって発生する懸濁粒子の増加が生物に影響を及ぼす可能性があります。水中を撮影した画像から懸濁粒子数を検出することで、懸濁粒子が海洋環境にどのような影響を与えるのかを評価するための基礎となることが期待されます。

参考：産業技術総合研究所「AI技術を用いた深海における環境影響評価手法を考案」

新しい物体を世界最高精度で検出／株式会社東芝

東芝の「Few-shot物体検出」は、対象物体の画像データを1枚登録するだけで、すぐにその物体を他の画像や動画から検出できるシステムです。例えば、業務用ヘルメットの画像を登録すると、建設現場の画像や動画から同じヘルメットを検出できるようになります。

AIによる再学習が不要で、新しい部品や部材を使うことが多いような現場でも、スムーズな物体検出が可能です。作業工程や納品物が変わりやすい現場で、特に役立つことが期待されます。

参考：東芝「Few-shot物体検出 | 東芝AI技術カタログ」

衛星画像から物体を検出／三菱重工業株式会社

三菱重工業は、衛星側で衛星画像から物体を検出（検知）するオンボードAI物体検知機「AIRIS（アイリス）」を開発しました。例えば、海上にある船舶を撮影対象にした場合、物体検出によって船舶が写っている部分のみを切り取って地上に送信します。その画像を用いて地上でAIを再学習させ、そのデータを軌道上の機器（AIRIS）に送信することでAIのアップデートを繰り返します。

現在は、実際に軌道上で機器が使えるのかを実証するフェーズであり、この実証を通じて知見が集まることで宇宙空間の利用が拡がることが期待されます。

参考：三菱重工業「次世代宇宙用MPUを活用したオンボードAI物体検知機を開発」

物体検出の先端技術や最新情報を調べてみよう

物体検出には多くの手法があり、それぞれ改良・改善が進んでいます。用途に合わせた手法を選べる時代になっており、今後さらに革新的なシステムが登場するかもしれません。

実際に、導入される業務や業界は広がっており、様々な分野で実績を重ねています。他の事例にも目を向けて、物体検出の先端技術や最新情報を調べてみましょう。そこからさらに新しい可能性を見つけられるかもしれません。

（提供：CAC Innovation Hub）

著者THE OWNER 編集部
フォロー

今、読まれている記事

物体検出の仕組みとは？代表的な4つの手法と活用事例をくわしく解説

物体検出とは

物体検出の仕組み

物体認識との違い

物体検出の代表的な4つの手法

1.R-CNN

2.YOLO

3.SSD

4.DETR

物体検出の活用事例

建設現場の安全性向上を実現／東洋建設株式会社

ロボットカー向け物体検出ツール／株式会社ZMP

海洋環境のモニタリング／国立研究開発法人産業技術総合研究所

新しい物体を世界最高精度で検出／株式会社東芝

衛星画像から物体を検出／三菱重工業株式会社

物体検出の先端技術や最新情報を調べてみよう

宇佐美鉱油によるフジ・コーポレーションへのTOB成立

英語がペラペラな人の共通点

ケルヒャー、応援購入サービス「Makuake」で好評だった手のひらサイズのモバイル高圧洗浄機「OC Handy Compact」を一般発売

お尻の魅力と価値について

ステーキ宮、ライスバー復活･宮ハンバーグを2枚重ねた新メニューなど/グランドメニューを改定

猛暑によって引き起こされる「夏フレイル」に要注意、予防には適度な運動や魚肉ソーセージなどたんぱく質豊富な食品の摂取を

光通信、ザッパラスを株式交換により完全子会社化へ

イオン相模原SCが全館刷新、冷凍食品は地域最大級の品揃え、子育て世代に照準、年間客数1200万人めざす

【山口に伊勢があるって知ってた？】“西のお伊勢さま”山口大神宮に迫る【山口エリア】

【お酒好きは山口へ！】山口で見つけた絶品日本酒【山口エリア】

お笑い芸人から狂言師へ～子ども時代の自分に胸を張れる生き方を求めて～

宇佐美鉱油によるフジ・コーポレーションへのTOB成立

【山口に伊勢があるって知ってた？】“西のお伊勢さま”山口大神宮に迫る【山口エリア】

【お酒好きは山口へ！】山口で見つけた絶品日本酒【山口エリア】

猛暑によって引き起こされる「夏フレイル」に要注意、予防には適度な運動や魚肉ソーセージなどたんぱく質豊富な食品の摂取を

【セブン‐イレブン】政府備蓄米を活用して「100円引き」「米約1.5倍盛り」の弁当10品を販売

超人思考へのマインドセットで平和を目指す！現実に生きる「宇宙超人」の誕生秘話

英語がペラペラな人の共通点

ステーキ宮、ライスバー復活･宮ハンバーグを2枚重ねた新メニューなど/グランドメニューを改定

戸田建設、京都中央区京橋の超高層複合ビル「TODA BUILDING」に飲食店4店舗が順次開業

お笑い芸人から狂言師へ～子ども時代の自分に胸を張れる生き方を求めて～

旭化成ホームプロダクツ、ディズニーキャラクターをあしらった「ジップロック フリーザーバッグ」など4種4商品を数量限定発売

猛暑によって引き起こされる「夏フレイル」に要注意、予防には適度な運動や魚肉ソーセージなどたんぱく質豊富な食品の摂取を

国内初、“給食が食べられるカフェ”併設の給食センターが始動

体に優しいアイスの選び方 コンビニやスーパーで選ぶならこれ

ローソン、煮干しと昆布の旨味をたっぷり効かせた冷しラーメン「ニボコン」を麺処ほん田監修などご当地人気店とコラボして発売

丸美屋、日本の食卓に欠かせない「ふりかけシリーズ」の秋冬の新商品・リニューアル商品を発売

常石造船、グループ会社再編を発表

サマンサタバサ、Samantha Thavasaからディズニーキャラクターがデザインされたバッグ・財布・チャームを発売

県内随一の濃い泉質と割安な料金で根強い人気 業務の積極的なICT化により来客数増に対応 あいまがわ温泉（群馬県）

旭化成ホームプロダクツ、ディズニーキャラクターをあしらった「ジップロックフリーザーバッグ」など4種4商品を数量限定発売

体に優しいアイスの選び方　コンビニやスーパーで選ぶならこれ

県内随一の濃い泉質と割安な料金で根強い人気　業務の積極的なICT化により来客数増に対応　あいまがわ温泉（群馬県）