コラム

Column

【TechTarget掲載】ディープラーニングやAI 処理で高まる需要 急成長するGPU コンピューティングの今

ディープラーニングやAI 処理で高まる需要 急成長するGPU コンピューティングの今

ディープラーニングやAI 処理で高まる需要 急成長するGPU コンピューティングの今

2018年1月22日 TechTargetジャパン
"ディープラーニングやAI 処理で高まる需要 急成長するGPU コンピューティングの今"
https://wp.techtarget.itmedia.co.jp/contents/25596)にて掲載

かつてはゲーマーのための技術と言われたGPUだが、近年ではデータセンターに進出し、その活用が注目されている。ディープラーニングやAI技術の普及で注目されるGPUコンピューティングの今に迫る。

徹底解説:GPUコンピューティングが急成長する理由と減速する懸念

遅々として進まないデータ分析プロジェクトに苦慮しているITプロフェッショナルは、3Dゲームという思いがけない分野から解決の着想を得るかもしれない。

Graphics Processing Unit(GPU)はこれまでゲーマーの要望を満たすためにその機能を強化してきた。しかし、今では企業向けデータセンターの新たなニッチ分野として注目する関係者が増えている。451 Research のアナリストを務めるジェイソン・スタンパー氏によると、従来型ワークロードの中にはGPUの並列アーキテクチャに適しているものがあり、GPUで高速化した演算処理の恩恵を受けるという。

「GPU には最新のモデルで3500基を超える演算コアがあり、大画面を構成する膨大な数のピクセルでも一瞬の演算で描画できる。これをデータベースの行と列に当てはめれば、データを驚くほど高速に処理できる」(スタンパー氏)

CPUの動作クロックが2年ごとに倍増していた時代には、GPUがどれほど演算処理を高速化しても、その効果は特定の並列処理に限られていたため需要はほとんどなかった。だが、CPUの動作クロックの上昇 ペースが鈍るにつれ、高度な演算処理を必要とするタスクを抱えたユーザーは、CPUの代替としてGPUに目を向けるようになった。GPUは動作クロックではCPUに劣るものの、搭載する演算コアの数だけのスレッドを並行して処理できる。幾つもの変数による影響を同時に処理しなければならない物理シミュレーションなどの自然科学演算や気候現象などの実世界をシミュレーションする演算モデリングといった分野では、早くからGPUコンピューティングを導入してきた。

「現代の天気予報は、背後にあるスーパーコンピュータで何千もの要因を並列して処理してモデルを構築して算出している」とGPUベンダーのNVIDIAでデータセンターGPUコンピューティングの担当ディレクターを務めるロイ・キム氏は説明する。

いち早くGPUを汎用演算処理に利用し始めたのはスーパーコンピュータ技術者や科学研究者だが、一方で企業が収集して分析する用途でもデータの量はCPUの進化をしのぐペースで増大している。

SQLのためにCPUからGPUに移行する

ハーバード大学の中東研究課程を修了したトッド・モスタック氏は、卒業論文のために何億件というツイートを収集して「アラブの春」を検証した。モスタック氏の目的は、ツイートの分析を通じて地理空間を可視化することにあったが、CPUの演算処理能力を使うシステムを使っていて問題に突き当たった。

「そうした分析処理には1 晩中かかるものもあった。朝起きてから自分の間違いが判明し、演算処理を最初から全部やり直さなければならないこともあった」とモスタック氏は振り返る。これだけの負荷に対応できる大型サーバクラスタも利用できなかったモスタック氏は、市販のゲーミングGPUを使って自前のデータベースシステムを構築した。

彼がCEOとなったMapD Technologiesは、学生時代の試作品から生まれたSQL対応データベースのソフトウェアプラットフォームを構築している。GPUは3Dゲームの高精細でスムーズなグラフィックス描画処理以上に、SQLクエリの処理という、ゲームに比べると日常的な作業の高速化でも理想的だとモスタック氏は言う。

「突き詰めて言えばSQLはセット言語だ。そのセットにある全ての行に同じ作業を割り当てる。そのセットは何十億もの行で構成していることもある。しかし、GPUならば、搭載する演算コアの1つ1つに1行ずつ割り当てることで並列処理ができる」(モスタック氏)

GPUはあらゆる作業に適しているわけではない。明らかに並列的でGPUの恩恵を最大限に引き出せるプロセスがある一方で、遂次性が高くCPUで処理するのが最適なプロセスもある。また、既存のアプリケーションではプログラムソースコードをGPUのファンクションに対応できるようにリファクタリングを行うか、GPUで動作させる専用のものを新たに開発する必要がある。

こうした問題についてモスタック氏は、「その中間に位置する幅広いクラスの問題もある。それを並列処理するのは簡単ではない。だがコードをうまく構造化すれば、ここでもGPUの恩恵を引き出すことができる。これは演算をデータにどうマッピングするかという問題だ」と述べている。

GPUの波が全てのビジネスに押し寄せる

このようなGPUの演算処理能力を利用して3Dゲームなどのグラフィックス処理だけでないより広い目的に活用しようとするアプローチを「GPGPU」(General-purpose computing on GPU)または「GPUコンピューティング」と呼ぶ。ツイートを投稿した場所や言語を地図上で示すサービスの「MapD」などもGPUコンピューティングを活用している。その目的は、作業をCPUとGPUの間で分割することにある。アプリケーションのコードの大部分は逐次処理を必要とするものの、そのコードの中で集中的な演算処理能力を必要とする特定のプロセスをGPUに任せることができる場合もある。

組織で収集するデータの量が増える中、そのデータから価値を引き出すビジネスニーズも増大している。GPUコンピューティングを利用するデータベースに対する関心が急浮上し始めた理由はそこにあるとスタンパー氏は指摘し、「この分野は非常に堅調な成長が見られる」と予測した。

例えばNikeはGPU搭載のサーバとMapDのデータベースソフトウェアを使って過去の売り上げデータを分析し、特定地域の需要を予測している。同じくMapDを使っているVerizonは、携帯電話をトラッキングするサーバのログ分析にGPUコンピューティング対応システムを利用している。

GPUコンピューティングの活用に積極的なのはMapDだけでない。BrytlytやSQream TechnologiesはGPUコンピューティングを利用する分析処理に対する競合アプローチを提供している。SQreamのCEOアミ・ギャル氏は「これはデータの利用目的だけに影響する変化の波ではない。新しい需要を伴う全く新しいビジネスが登場しようとする変化を巻き起こす波でもある。Uberはタクシー業界を大きく変えようとしているデータ企業であり、Airbnbは宿泊予約システムと"貸し部屋"システムを大きく変えようとしているデータ企業だ」と主張する。

多くの主要クラウドプロバイダーも、GPUコンピューティングのインスタンス提供に乗り出した。この動きは実験的な分析や可視化プロジェクトを行う企業の参入コストを引き下げる。ただ、スタンパー氏によると、GPUを使った分析演算の需要成長が鈍化する懸念要因も多数あるという。その1つが、企業向けデータベースプラットフォームのように大型で複雑かつ高額なシステムでは、既に導入している機材を破棄してGPUコンピューティング対応システムに入れ替えることに対する抵抗が強いことだ。また、GPUコンピューティング対応データベースシステムを提供するベンダーの大多数は小規模な新興企業で、これまでの大手データベースベンダーのような知名度も営業部隊もなければサポートインフラも整っていない。

「経営層には自分たちが望む速度で経営判断に必要な分析結果が入手できないことへの不満はあるものの、IT部門に対しては、新技術への過度の出費や複雑なシステムの増大を阻止しようとするプレッシャーがある」(スタンパー氏)

それでも大規模なデータセットの分析を急ぎたい企業にとって、明らかな性能の強化は無視できないだろう。ワークロードによっては、サーバクラスタ全体をGPUコンピューティング対応データベースシステムに入れ替えることもできるとスタンパー氏はアドバイスする。

「スマートなアプローチ」とは

1基のハイエンドGPUでCPUベースのサーバクラスタを超える処理速度でスレッドを同時に処理できる性能は、台頭しつつある別の種類のワークロードにも適している。

NVIDIAのキム氏は、「ここ数年で人工知能と機械学習に大きな転換点が到来している。偶然にもそれが理想的な並列ワークロードだった」と語る。

人工知能に対するアプローチは幾つかある。だが汎用演算に対応したGPUコンピューティングの台頭で急成長しているのがディープラーニングだ。

人工知能のディープラーニング分野では、人の脳神経の配列を、コンピュータノードの仮想ニューラルネッ トワークで再現する。1つのネットワークは複数の層で構成し、それぞれのノードが特定の機能を実行する。人工知能は各ノードから出力するデータを使って人のように「推論」する。この概念は数十年前から存在していたが、ごく最近まで、非常に大型のクラスタやスーパーコンピュータを使わなければ、安定したニューラルネットワークは構築できなかった。

音声認識ソフトウェア「Dragon NaturallySpeaking」を手掛けるNuance Communicationsは、GPUコンピューティングを使ったディープラーニングニューラルネットワークで言語学習モデルを開発している。

Nuanceで研究ディレクターを務めるニルス・レンケ氏は「システムのトレーニングでは、サンプルとして何千回もの発声を示すことによって言語を理解させている。これには大量の演算を伴う。こうしたネットワークでは、ノードが単純な計算を実行する。同じことを同時に実行しなければならないノードが大量にあることから、GPUはこの作業を手助けするのに最適だ」と説明する。

人工知能の筆頭級フレームワーク多数を含め、GPUコンピューティングをサポートするアプリケーションの数は増えている。

GPUの前途は有望だが、それでもCPUを補う技術がGPUだけとは限らない。Intelが167億ドルという多額を投じたのは、GPUではなく、Field Programmable Gate Array(FPGA)だった。GPUと同様、FPGAでは特定の演算をCPUと比べて高速に処理できる。FPGAは汎用プロセッサの役割を果たすのではなく、プログラミングによって、特定の命令をより効率的に実行できる。

GPUを使う代わりに、RyftではFPGAコンピューティング対応データベース分析プラットフォームを提供している。Microsoftも最近になって、Azureベースの人工知能サービスに、AlteraFPGAを使っていることを明らかにした。

「GPUであれFPGAであれ、高速化が進むべき道であることははっきりしている」とキム氏は訴えている。

GPUがけん引する"ハード黄金時代"、ディープラーニングやAI処理で需要高まる

IT業界ではかなり前から、ハードウェアを重視しなくなっている。だが、2017年にはディープラーニングの台頭に伴い、この状況は変わりそうだ。

Forresterのアナリストを務めるマイク・グアルティエリ氏によると、われわれは、主にGPU(Graphics Processing Unit)がけん引するハードウェアの黄金時代に入ろうとしているのかもしれない。

GPUのニーズが増大

従来のCPUに代わって主役となるGPUは、タスクの逐次処理ではなく並列処理に最適化されている。そのためにGPUチップはディープラーニングモデルを訓練するのに適している。この訓練では、モデルが画像認識や、自然言語解析、オンライン買い物客への商品の推奨などを行えるようになるまで、膨大なデータ処理が何度も繰り返し実行されるからだ。

「今日のコンピューティングでは、こうしたモデルを訓練する必要がある。故に、ハードウェアルネサンスが到来するだろう」とグアルティエリ氏は述べる。

GPU技術は数十年前から存在しているが、企業が注目するようになったのはつい最近だ。GPUは従来、名前が示しているように、コンピュータのグラフィックス処理に使用されてきた。だが、ディープラーニングや人工知能(AI)が脚光を浴びるとともに、モデルを訓練するために高速な並列計算の必要性が高まっている。

「数年前には、われわれはこうした特殊なハードウェアには目を向けていなかった。だがディープラーニン グでは、多くの並列処理を実行することになる。GPUベースのツールなら、多数のコアが利用できる」。調査会社STORM Insightsの創業者エードリアン・ボールズ氏はそう語る。

ボールズ氏は、2017年にはGPUチップ市場が活況を呈するだろうと見ている。分析用にGPUチップの販売をいち早く開始した企業の1つであるNVIDIAは、2016年にIBM、Microsoftと提携した。コグニティブアプリケーションが実行されるサーバでのNVIDIA GPUの採用を促進する狙いだ。プロセッサ最大手のIntelも、GPU技術への取り組みを深めようとしているようだ。

GPUの普及で開発者に求められる変化

ボールズ氏は、GPUの普及が進めば、場合によっては、開発者は新しい仕事のやり方を学ばなければならないかもしれないと指摘する。GPUのデータ処理方法はCPUとは非常に異なるため、GPUのメリットをフルに活用するには、アプリケーションを従来とは異なる手法で作成しなければならない。このため、開発者が今後、GPUが使用される先進的な分野でもスキルを発揮していくには、トレーニングを積まなければならない。

同様に、多くの企業が、GPU技術を中心に据えたデータアーキテクチャの構築に着手するだろうと、ボストンカレッジのITマネジメント教授トム・ダベンポート氏は予想する。同氏はインターナショナルアナリティクスインスティテュートの共同創設者でもある。

ダベンポート氏はWebキャストで、「多くの企業が、ディープラーニングモデルをベースにした画像認識技術の実装方法を調査している」と話している。Google、Uber、Tesla Motorsといった企業は自動運転車の開発を進めているが、自動運転車の技術もディープラーニングのアルゴリズムに大きく依存している。こうしたタイプのタスクの役割が拡大していることを受け、GPUの需要が増加するだろうと、同氏は考えている。

「GPUに特にフォーカスしたさまざまなコンピューティングアーキテクチャが登場してくるだろう。これは、画像処理やその他のアプリケーションで使われるこうしたディープラーニングモデルの成功の一部と捉えることができる」(ダベンポート氏)

GPU技術は、"市民データサイエンティスト"※という新タイプのユーザーの登場や増加という動きに拍車を掛ける可能性もあると、ソフトウェアベンダーのMathWorksで技術マーケティングマネジャーを務めるポール・パイロット氏は語る。

※citizen data scientist。調査会社Gartnerの用語。職業としてデータ分析を専門に行う通常のデータサイエンティストに対し、仕事の一環としてデータ分析を行うビジネス部門などの一部の担当者を指す。

パイロット氏は、Amazon Web Services(AWS)が2016年に、「Amazon Elastic Compute Cloud (EC2)」サービスでGPUチップを利用できるようにしたことを指摘する。EC2は全てクラウドでホストさ れているので、ユーザーはハードウェアの専門家である必要はない。このため、EC2へのGPUオプションの追加は、GPUの導入のハードルを下げ、利用の裾野を広げることになる。「ディープラーニングや、行動指針をもたらす処方的分析(Prescriptive Analytics)、ビッグデータのワークフローが利用しやすくなる」(パイロット氏)

GPUサーバーからHPCインフラまで。ハードウェア黄金時代のニーズに応える、データドックの新潟・長岡データセンター

ハウジングサービスはこちら

Contact

データセンター見学のお申し込み、サービス詳細や価格、資料請求など
お気軽にお問い合わせください