Appleは長年、自動運転の研究を秘密にしてきたが、今回、障害物検知を向上させる自動運転ソフトウェア技術の一部を公表した。
Appleの人工知能と機械学習の専門家であるYin Zhou氏とOncel Tuzel氏によって11月17日にモデレートされた科学的プレプリントリポジトリarXivで発表されたこの論文は、光検出と測距(LiDAR)の感知方法を使用して小さな障害物を検出する方法について概説している。
Appleの科学者たちは、手作業で作成された特徴表現(例えば鳥瞰図投影)に頼るのではなく、点群ベースの3D検出のための、エンドツーエンドで学習可能な新しい深層アーキテクチャを提案しています。VoxelNetと呼ばれるこのアーキテクチャは、疎な3D点群に直接作用し、3D形状情報を効果的に取得できます。
VoxelNet技術を用いた初期実験では、最先端のLiDARベースの3D検出手法を大幅に上回る性能が示されました。歩行者や自転車の3D検出といったより難易度の高いタスクにおいても、VoxelNetアプローチは優れた結果を示し、より優れた3D表現と検出を実現しています。
緑色の3Dボックスは、LiDARを使用して検出された潜在的な障害物を示します。
3D ポイント クラウド内のオブジェクトを正確に検出する機能は、障害物回避に非常に重要です。
論文より:
VoxelNetは、点群を等間隔の3Dボクセルに分割し、新たに導入されたボクセル特徴エンコーディング(VFE)層を通じて、各ボクセル内の点群を統一された特徴表現に変換します。これにより、点群は記述的なボリューム表現としてエンコードされ、その後、RPNに接続されて検出結果が生成されます。
KITTI車両検出ベンチマークを用いた実験では、VoxelNetが最先端のLiDARベースの3D検出手法を大幅に上回る性能を示すことが示されました。さらに、本ネットワークは様々な形状の物体を効果的に識別する表現を学習し、LiDARのみを用いた歩行者と自転車の3D検出において有望な結果をもたらしました。
投稿の上部に図示されている VoxelNet アーキテクチャは、生のポイント クラウドを入力として受け取り、空間をボクセルに分割し、各ボクセル内のポイントを形状情報を特徴付けるベクトル表現に変換する学習ネットワークを備えています。
配車サービス市場と社内キャンパスシャトルサービスに狙いを定めていると言われる同社の自動運転研究に関して、Appleがオープンになり始めているのは素晴らしいことだ。
iPhoneメーカーは自動運転に多額の投資を行っており、その分野で「大規模なプロジェクトが進行中」だとCEOのティム・クック氏は語る。