知識ゼロでもわかる！機械学習でなぜGPUが使われるのか？

こんにちは、EventHubでエンジニアをしているkomatsuです。

本記事はEventHub Advent Calendar 2023の9日目の記事です。

昨日は田母神さんの「EventHubのCSってどんな感じ？まるっとご紹介ベスト5！｜たもがみ（EventHub CS）」でした。こちらもぜひ！

note.com

思い返すと2023年はまさにAIの年だったなと振り返ることができます。

Open AIが3月に一般的な人の知識レベルを持つというGPT-4を発表し、4月には同社CEOのサム・アルトマン氏が来日。

マイクロソフトはいち早く検索エンジンBingにGPT-4を取り入れました。

また、GoogleはGPT-4を上回る性能を持つという生成AI「Gemini」を発表。

技術的な部分だけでなく、サム・アルトマン氏のOpen AI取締役会からのCEO追放騒動などその動きに一気に注目が集まったニュースもありました。

そんな本年でしたが、12月にはAI企業に欠かせないGPUを開発している米NVIDIAのジェンスン・フアンCEOが来日し岸田首相や西村経産相と面会したことも最近ニュースになりました。いつも革ジャンで有名なフアンCEO。「色を考えなくていいから」が理由だそうです（本当か？

www.nikkei.com

NVIDIAといえば、数年前には日経ビジネスオンラインにて「謎の半導体メーカー」と言われたことも記憶に新しいですが、

business.nikkei.com

この10年間で株価は100倍、今年だけでも本記事執筆時点で年初来230%以上上昇している半導体企業です。

そこで、本記事ではなぜAIにGPUが必要なのか？という点について書こうと思います。

GPUとは何か？
GPUとCPUは違うのか？
なぜAIにGPUが使われるのか？
まとめ
お知らせ
参考文献

GPUとは何か？

まずGPUとは何かについて。

Graphics Processing Unitの略で名の通り画像処理を目的とした装置です。

画像・映像をより綺麗に出力するために必要な装置で特徴としては並列処理が得意であり、膨大なデータを速く計算処理することができます。

GPUを開発している企業として代表的なのは上で書いたNVIDIAや、AMD、Intelといったアメリカ企業が続きます。

GPUとCPUは違うのか？

GPUは上記の通りですが、似ている言葉にCPUがあります。

言葉は似ていますがGPUが画像処理専門特化であるのに対して、CPUはコンピュータの汎用処理を担います。汎用処理というのは、コンピュータを動かすのに必要な命令を判断してそれぞれの装置に命令を出すようなイメージです。

そのため、GPUとCPUは言葉こそ似ていますが担っている役割はそれぞれ異なります。

なぜAIにGPUが使われるのか？

上記のようにGPUは膨大なデータを処理するのに適した装置であります。

現代のAI技術の中心となっているディープラーニングでは大量の積和演算や大きな行列の積を計算する必要があります（ここではディープラーニングの積和演算などについての説明は割愛します）。

その計算処理はまさにGPUが得意とする部分であり、元々は画像処理を目的とした装置でしたがその計算処理に着目され、今では各社がGPUを用いてAI開発を行なっているということです。

また分散学習も処理の高速化に必要な技術です。これは複数のコンピュータやGPUを使い計算を分散させて行う考えです。

上の図はTensorflowという機械学習フレームワークにてGPUの数を増やした場合に、GPUひとつの時と比べてどれだけ高速化されたかを示した図です。

Announcing TensorFlow 0.8 – now with distributed computing support! – Google Research Blog

これは100個のGPUで分散学習をした場合に56倍の性能が出るということで、GPU1個で7日間かかっていた処理が3時間で完了することになります。

複数のGPUを使うことで処理は高速化できますが、トレードオフでコストは増加します。そこはビジネスとの天秤になる部分かと思います。

このようにGPUを複数使って分散させることで学習の高速化が可能となり、膨大な量の計算処理が必要になるディープラーニングにGPUは欠かせない装置であることがわかります。

このように高速化が可能な分散学習ですが、コンピュータ間のデータの同期や通信といった点で複雑性があり難しいテーマであります。しかし、計算処理の向上を目的として色々な機械学習フレームワークがGPUでの処理をサポートしており、開発者はそれらのフレームワークを使うことで高速なデータ処理を行うことが可能となっています。