Unity を検索

合成データによるシミュレーションでロバストな機械学習モデル学習を実現

2020年5月1日 カテゴリ: テクノロジー | 4 分 で読めます
シェア

Is this article helpful for you?

Thank you for your feedback!

合成データは、多くの組織にとって、機械学習モデルのトレーニングに必要なラベル付きデータを取得するという課題の解決に役立つものです。このブログを皮切りに、知覚システムを訓練するための合成データに関するシリーズを連載していきます。第 1 弾となるこの記事では、合成データの簡単な概要と、合成データが可能にするユースケースの幅の広さについて説明します。

ここ 2、3 年で、機械学習(ML)の将来性はほぼすべての業界に認められるところとなりました。しかし、ML モデルを訓練するために高品質のラベル付きデータを収集することは、依然として大きな課題となっています。最近の調査では、96%の企業が機械学習プロジェクトで学習データの品質とラベリングの課題に直面していることがわかりました。

組織がロバストな ML モデルの入手に必要な、十分な量のラベル付きデータを収集することを困難にしている要因には、以下のようなものがあります。

  • プライバシーと規制に対する懸念:例えば、小売店内のビデオ映像には顔の情報が含まれている場合がありますが、これは個人を特定できる情報とみなされ、様々な規制によって管理されています。
  • ML モデルの選択バイアスにつながる、実世界シナリオからの非網羅的なサンプル:例えば,ある物体がある 1 つのポーズを取っているサンプルしかないデータセットで ML のモデルの学習を行うと、その ML は同じ物体が様々なポーズを取った場合にまったく対応できないという事が起こりえます。
  • 再現の可能性が低い、再現の費用が高い、あるいは再現することに危険が伴うなどの理由で、現実に再現することが困難なコーナーケース:例えば、自動運転車の学習について、道路の上で普段見ない障害物や異常気象に遭遇するようなケースです。

合成データは、これらの課題の多くに対する解として注目されています。OpenAI(Tobin et al., 2017)や Google(Hinterstoisser et al., 2019)の研究者は、物体検出などの実世界のタスクにおける合成データの有効性を実証することに成功しています。グラフィックス処理の進歩とスケーラブルなコンピューティングにかかる費用の低減により、没入感のあるビデオゲームや映画の開発に使用されるのと同じツールやシステムを活用して、実世界のフォトリアリスティックな合成画像をシミュレートすることが可能になりました。ここでは、Unity エンジンを使って、3D オブジェクトから再現度の高い家庭用品の画像を作成した例を紹介します。

Unity の 3D アセット *

3D モデルから生成されたフォトリアリスティックな合成画像 *

ラベル付けされた合成画像 *

このようにして生成された画像は、追加コストなしでラベル付けされ、コンピュータービジョンアルゴリズムの学習データとして使用することができます。これらのアルゴリズムは、複数の産業分野にまたがって実世界アプリケーションに適用することができます。以下、そのようなアプリケーションをいくつか紹介します。

倉庫・物流のロボットによる自動化

電子商取引の物流センターのような環境では、重量物のピックアンドプレースやデパレタイズなどの作業は、反復的な作業であるだけでなく、危険な作業でもあります。このような環境にロボットを導入したことで、私たちのサプライチェーンはより安全効率的なものになりました。しかし、倉庫ロボットは、サイズや形状、重量が異なる多様な商品を継続的に認識するという課題に直面し続けています。この課題に対して、新製品のバリエーションの合成画像を作成することで、ラベル付けされたトレーニングデータを収集するためのコストとターンアラウンドタイムを大幅に削減することができます。OpenAI の研究では、複雑な操作をロボットに学習させ、実世界で実行させる上での合成データの有効性が実証されています。

小売業におけるレジなし精算

もう 1 つの興味深い例として、小売業におけるレジなし精算導入店舗があります。棚に設置されたオーバーヘッドカメラや重量センサーを使用することで、小売チェーンはプライバシーに準拠した方法で人や商品を追跡することができます。また、商品の SKU のリアルな画像を使用し、棚から商品を選んだり、カートから商品を取り出したり、カートの商品を入れ替えたりといった複雑な店内での買い物客の行動をシミュレートすることで、コンピュータビジョンモデルはより正確に実世界の微妙なシナリオを検出し、買い物客と小売店の双方に好ましい体験をもたらすことができるようになります。加えて、純粋に合成データに基づいて訓練されたコンピュータビジョンモデルが、食料品店の商品にも有効であることを示す具体的なエビデンスがあります。

天井に設置されたカメラにより、Amazon Go の店舗ではレジなし精算が可能に(画像提供:SounderBruce

製造業における外観品質検査

他にも、製品の組立ラインでの手作業による品質検査など、合成データの恩恵を受けられる見込みのある、価値の高い分野があります。これは退屈でエラーが発生しやすい作業ですが、最新のコンピュータビジョンをベースにした自動化により、目に見える形で効率が向上しました。しかし、自動化された検査プロセスで高レベルの精度を達成するためには、多種多様なシナリオを表現するための膨大な量のデータが必要となります。ホットソースの瓶を梱包する組立ラインが学習しなければならない変数の数を想像してみてください。ラベルの歪み、情報の欠落、瓶の中のソースの量、ソースの変色などがあります。これらの異常は現実世界ではほとんど発生しません。このような異常を多数シミュレートし、起こりそうな現象をすべて網羅するのに十分な大規模なデータセットを生成することで、このような異常を学習し、ML モデルをさらにロバストにすることができます。

画像提供:OAL

このブログシリーズの次回記事では、Unity のツールを活用して大規模な合成データセットを生成し、物体検出などのタスクのために機械学習モデルを訓練する方法について、さらに詳しい内容をご紹介します。

もっと学びたい方へ

弊社の新サービス「Unity Simulation」を使って、まずは独自の合成データの生成をやってみましょう。合成データを使用して知覚システムを効率的に学習させる方法については、こちらの GTC 2020 セッションをご覧ください。

皆さんからの声をお待ちしております。ご質問やご意見は、この記事のコメント欄に投稿いただくか、perception@unity3d.com までお寄せください。

* すべての商標はそれぞれの所有者に帰属します。

ヘッダー画像:CVC Barcelona とベルビュー市の共同制作

2020年5月1日 カテゴリ: テクノロジー | 4 分 で読めます

Is this article helpful for you?

Thank you for your feedback!