「ディープラーニング」が製造業にもたらすインパクト


世界を変えるAI技術「ディープラーニング」

2016年06月13日 更新
[矢戸 知得(NVIDIA),MONOist]

著者プロフィール

2005年にカリフォルニア大学サンタバーバラ校のコンピューター工学科を卒業後、ソニー株式会社に入社。

GPSカーナビゲーションシステムやタブレットの組み込み開発に携わった後、ソニー・コンピューターエンターテインメントにて家庭用ゲーム機の周辺機器の商品企画を担当する。2013年にNVIDIAに入社。現在、テクニカルマーケティングエンジニアとしてNVIDIAの技術や取り組みについて周知する活動やトレーニングなどの活動に従事。

 

*人工知能の躍進を進める「ディープラーニング」

 「人工知能」「ディープラーニング」というキーワードが注目を集めています。

ディープラーニングは、ここ数年で人工知能を大きく躍進させるテクノロジーとして注目されるようになりましたが、特にここ1年の人工知能の躍進は目を見張るものがあります。
 ディープラーニングの名を広めたIMAGENETチャレンジ(コンピュータビジョンによる画像認識コンテスト)ではMicrosoftとGoogleのグループによる人工知能が、とうとう人間の認識レベルを超える結果を達成しました。

加えて、ディープラーニングは画像認識の分野だけではなく他の分野でも利用されています。

図 1 2016年1月の「CES 2016」にて、トヨタ自動車が自社ブースにて行ったディープラーニングを利用した衝突回避デモ

 トヨタ自動車はディープラーニング用フレームワークを開発するPreferred Networkと協力し、2016年1月のCESで強化学習を利用した自動運転のデモを行いました(2017年のCES、主役は自動運転に替わって人工知能になる?)。

またポップカルチャーにも影響を与え、Perfumeなどのデジタル演出を手掛けるRhizomatiks Researchがディープラーニングを作品作りに利用しています。
 そして記憶に新しい、AlphaGoの歴史的な偉業です。あと10年は人間に太刀打ちできないだろうといわれていた囲碁の世界で、DeepMindの開発したAlphaGoが韓国のイ・セドル9段を破ったのです。
 もはやディープラーニングは1つのアルゴリズムや、1つのフィールドだけで使われるものではなく、もっともっと大きな潮流となっているのです。


*ディープラーニングの特徴――新しいコンピューティングモデル

 ディープラーニングは新しいコンピューティングモデルといえるものです。

図 2 従来手法とディープラーニングを利用した物体認識の比較

 従来の手法はそれぞれの分野の見識をもつ専門家(ドメインエキスパート)がそれぞれ違うソフトウェアをひとずつ書いて実現する、というものでした。

一方、ディープラーニングビッグデータと、それを入力して自ら学んでいくことのできる多層構造のニューラルネットワークを大規模に処理することで、より一般的な方法で多くのものに対応することが可能です。
 Baiduは1つのニューラルネットで英語と中国語の音声認識を可能にしました。このように中国語のエキスパートと英語のエキスパートをそれぞれ必要とするのではなく、1人の言語エキスパートがいればいいのです。物体認識のアルゴリズムはAlphaGoでも使われ、それはアタリのゲームをプレイする時も同じ、1つの汎用的なアルゴリズムがさまざまな問題に対応するのです。

 従来との違いは、それぞれの専門家が時間をかけてアルゴリズムをチューニングしていくのに対し、ディープラーニングではビッグデータと巨大なニューラルネットワークを処理可能な計算能力によってそれを実現していくところです。ソフトウェア開発に対する非常に大きな違いです。


図 3 IMAGENETコンテストにおけるトップ成績の推移

 この方法の大きなメリットを一目で理解していただけるのが、図3のグラフです。

青い点従来型のコンピュータビジョンのアルゴリズムを専門家が時間をかけてチューニングをして、認識率を上げていったものに対し、ディープラーニングがビッグデータの学習をGPUのパワーを利用して実行して、人間を超える成果を出したことを表しています。



*今、人工知能の進化をリードする3つの要素

 今までも人工知能が技術トレンドとして脚光を浴びたことがありました。そのため今を第3次人工知能ブームと呼ぶむきもあります。

図 4 人工知能の進化を加速する3つの要因

しかし実験室内の研究成果だけで終わらず現実のサービスにも本格利用されるようになってきている今、多くの人が今の人工知能にかつてないレベルの期待を寄せています。
 それは今の人工知能を進化は、過去にはない3つの要素があり、それによってけん引されているからだと指摘されます。

3つの要素とは「ビッグデータ」「最先端のモデル」「GPUアクセラレーター」です。


- ビッグデータ

 ニューラルネットワークの学習には大量の学習用データが必要です。

現在は、インターネットに接続される多くの機器から日々大量のデータが生成されています。ビッグデータです。
 例えばYouTubeには毎分、400時間に相当されるビデオデータがアップロードされているといわれますし、他にも今後は身につけるIoTデバイス等からもさまざまなデータが生成されてくることになるでしょう。
 人力では処理しきれないほどのこの豊富なデータを利用してコンピュータ自身に学習を行わせることで、従来の手法では見つけられなかったような特徴が見いだされ、利用できるようになります。


- よりよいモデル

 ニューラルネットワークのモデル(アルゴリズム)は、かつて提案されていただけだった手法も効果があるものと実証され、それをベースに改善や新しいモデル・手法が生み出されていっています。
 大学を中心に出発したこの“ディープラーニングのビッグバン”には、IT系の巨大企業が更に多くの研究リソースを投下しているので、その進化のスピードは今後さらに加速していくでしょう。


- 強力なGPUアクセラレーター

 ビッグデータがあり、より進化した複雑なニューラルネットワークのモデルがあっても、それを実行できる高速なコンピュータがなければ現実的な利用はできません。かつてはここにもコンピュータの絶対的な処理能力という壁がありました。
 特にニューラルネットワークの学習プロセスは非常に膨大な計算量が必要とされるので、より大量のデータや新しいモデルが用意できても、その有効性を実証することを現実的な時間内に行うことが難しかったのです。

 

 今はこのニューラルネットワークの処理に、並列処理に長けたアーキテクチャを持つGPU(グラフィックス処理装置)が非常に有効であること分かり、GPUがディープラーニングに標準的に使われるようになっています。


*組み込みでの応用方法

 前章では、ディープラーニングを活用して達成された研究事例などを見ました。

これらの話は、基本、大規模なデータセンターや高性能ワークステーションでの事例でした。

それでは、このディープラーニングの躍進は、組み込みや特に製造業の世界にどういう影響を与えるのか、考えてみたいと思います。

図 5 学習処理の模式図

図 6 推論処理の模式図


- 学習処理と推論処理
 ディープラーニングで世の中の問題を解決するとき、2つの処理があります。「学習処理」と「推論処理」です。

学習処理は、大量の学習データをコンピュータに見せるようなものです。1つのデータごとに、順伝播と逆伝播の処理を行い、それを膨大なデータで何度も繰り返します。非常に計算量の多い処理のため、GPUで加速したサーバを利用しても、この処理には何日もかかることがあります。この結果、出来上がるのが、「学習済みのモデル」です。
 この作られた学習済みのモデルへ未知のデータを与えて、それを1回の順伝播処理に通して判断させるのが、「推論処理」です。推論処理も、まだ計算負荷の高いものですが、それゆえにさまざまな手法が模索されています。
 推論処理の1例として、GPUを搭載した組み込みプラットフォームの利用があります。NVIDIA「Jetson TX1」のようなGPUのパワーをアクセラレーターとして利用できる組み込みプラットフォームを利用すれば、サーバのような大規模計算能力を搭載できない組み込み機器でも、複数・複雑なネットワークを利用可能となります。

 Jetson TX1を使ったロボット、ドローン、警備システムなどは、膨大なデータとそれを高性能なGPUサーバで学習させた成果を利用して、人・動物・車両の識別や、音声・自然言語の認識、その他、従来技術では困難であっても、ディープラーニングならば効果的に解決できると見えてきたタスクをこなせるようになりました。

図 7 Jetson TX1 モジュール(左)とJetson TX1 開発キット(右)。モジュールから専用の400ピン・コネクター経由で各種信号線が引き出され、キャリアボード上の各種インタフェースに接続される。右の写真はキャリアボードに Jetson TX1 モジュール(ヒートシンク・ファンつき)が載っている状態

図 8 エンルートの開発している高自律型ドローン。Jetson TX1を搭載しており、飛びながら対象物をディープラーニングにて認識・識別して機体制御に利用する機能を持つ



*学習し続ける人工知能のサイクル

 学習処理と推論処理を同一の機器で行う必要はありません。大量のデータ読み込ませる必要のある学習処理は高性能なGPUサーバ上で行い、その結果、作製された学習済みモデルを利用して組み込み機器に搭載されたJetson TX1上で推論処理を実行するという実装も可能となります。

ここでは、このフローから導ける活用法について説明します。

図 9 「学習を続ける人工知能」を実現するサイクル

 例えば、さまざまな製品画像を認識できるニューラルネットワークを学習させて、倉庫ロボットを作ることを考えてみましょう。
 完成したこのロボットは、自律的に倉庫を移動し、棚や箱の中の各製品を識別することができます。しかしある日、今まで扱っていた製品とは全く見た目の異なる製品が登録されて倉庫内で扱われるようになったとしましょう。
 ロボットはこの製品を扱うことが出来なくなってしまいますが、ここで解決方法があります。

認識できなかった製品のカメラ画像をサーバに送り、サーバ側では、この製品を含む新たなデータセットを利用して再度学習処理をまわし、より賢くなった学習済みモデルを作ります。

アップデートされた学習済みモデルは、倉庫内の全てのロボットにネットワーク配信され、これによって全てのロボットがより賢くなり、新しい製品も扱えるようになるのです。



*製造業におけるディープラーニングの活用事例

 ディープラーニングを有効活用できる考えられる分野は多岐にわたります。

図 10 ディープラーニングの応用領域

ここでは特に製造業・ものづくりの分野での応用可能性を見ていきましょう。

最初に思い付くのは、工場のラインで行う外観検査への応用です。
 IMAGENETコンテストの結果からも分かるように、ラインのカメラが得た画像から不良部品を認識するタスクにおいても、従来のコンピュータビジョンの手法で人が1つずつ組み立てたアルゴリズムより、学習したニューラルネットワークを利用して認識させる手法のほうがより高精度かつ、汎用性を高く保つことが期待できます。
 フィンランドのラッペーンランタ大学では、更にカメラ画像だけではなく複数のセンサー情報を利用して、高張力鋼の溶接プロセスにおいて溶接の失敗を発見し修正するシステムの研究が行われています。

ガスシールドアーク溶接の品質に影響する多数の変数(溶接電流、放電電圧、ワイヤー繰り出し速度、移動速度、溶接ガンの位置)を、ニューラルネットワークを利用して結果品質が一定範囲に収まるようにコントロールするというものです。


図 11 「2015 国際ロボット展」にてファナックが行ったピッキングロボットのデモ

 日本で有名な応用例の1つはPreferred Networksとファナックが協力して実現した、ピッキングロボットの事例でしょう(熟練技術者のスキルを8時間で獲得、ファナックが機械学習ロボットを披露)。ロボットが「バラ積みされた部品のどこを空気吸引でつかむべきか」を、自分で取得した大量の画像データ(とその結果)を利用して学びとります。
 十分なデータを利用して学習させたニューラルネットワークは、従来の熟練エンジニアがコーディング・チューニングした結果に匹敵する性能を達成しました。チューニングの自動化や、複雑な形状への対応の可能性も広がり、まさに工場機械のスマート化を予見させる事例です。
 工場・倉庫のスマート化を推し進める取り組みとして、「Amazon Picking Challenge」というコンテストがあります。コンテストにおいて中部大学の藤吉先生らが率いるチームは、さまざまな照明の変化や商品が隠れていたり、ラップにかけられていたりするようなバリエーションにも対応できるようにするため、ディープラーニングの手法を利用して把持位置を学習させました。


図 12 Preferred Networks(「NVIDIA Deep Learning Day 2016 Spring」講演資料より)

 Preferred Networksが発表した、ディープラーニングを利用した異常検知という応用もあります。工場の稼働率を保つために工場機器のモニタリングは重要ですが、複数のセンサー情報から異常を検知したり、いつ機器が壊れるかを予想したりするのは非常に難しいタスクです。

 従来は、この分野の専門的な見識をもつ専門家がその見識・経験に頼って手で検知アルゴリズムを組み立てていましたが、これにディープラーニングを適用して自動で異常検知するアルゴリズムを学び取らせてしまうというものです。結果、従来の手法では直前にしか分からなかった故障予測がディープラーニングを利用することで40日前に分かるようになるという成果があがりました。


 あらゆるもののIoT化が進むにつれ、それらの機器から生成されるデータもビッグデータの一部をなし、どのようにその膨大なデータを解析するのか、ということが課題になります。場合によっては大量にデプロイされるIoT機器からの生成されるビッグデータは、それぞれごとに人が処理するアルゴリズムを組んでいくことが難しいので、ここでもディープラーニングの活用が期待されます。


*幅広い産業分野での活用が始まるディープラーニング

 人工知能の進化を進めるディープラーニングの特性とその応用例を見てきました。ディープラーニングは、ビッグデータと研究が進むモデル、そしてそれらを処理可能な計算能力を利用して、従来専門家が時間をかけてチューニングしてひとずつ作りあげるアルゴリズムをしのぐ性能と汎用性を実現する、新しいコンピューティングモデルといえるものだということを理解してもらえたと思います。
 ディープラーニングの技術は、サーバ上やピュアなIT業界にその活用範囲が限られるわけではなく、幅広い産業に適用可能なものです。既に製造業でも紹介したような活用・検討が始まっています。サーバ上で既に起こっているようなディープラーニングを利用した新しいサービスの登場や従来手法では不可能だったことが実現されるようなことが、今後どんどん起こるかもしれません。ディープラーニングの技術の進化とその適用は、今後も目が離せないトピックになるでしょう。


メール・BLOG の転送厳禁です!!  よろしくお願いします。