従来、数日~数週間かかっていた機械学習タスクが一晩で完了し、おまけに複雑な設定やマシンの導入・保守コストが削減できたらそんな素晴らしいことはないだろう。
GoogleがGoogle Cloud Platform(GCP)上でベータ版を公開した「Cloud TPU」は、これを可能にするかもしれない。
・180TFlopsの機械学習アクセラレーターをクラウドで
Googleは、2016年に第一世代のTPUを発表して以来、これの公開に向けて準備を進めてきた。
当初、機械学習モデルを適用して結果を得る「推論」のみに用いられたTPUは、2017年発表の第二世代では機械学習モデルを作成する「トレーニング」にも対応し、1ユニットあたり180TFlops(テラフロップス:180兆回/1秒の浮動小数点演算)の高速演算が可能となっている。
今回のパブリックベータ版提供開始により、機械学習をより高速に実行したいと考える研究者は強力なツールを得たことになるだろう。
さらに年内には、独自の超高速ネットワークを介することで、PFlops(ペタフロップス:1000兆回/1秒の浮動小数点演算)級の機械学習向けスーパーコンピューター「TPUポッド」として利用できるようになるようだ。
・TPUポッドでは1日のトレーニング時間が30分未満に
Cloud TPUを活用すれば、従来必須だった、マシンやネットワークの設定やプログラミングのための高度な専門知識習得も、案件によってはショートカットできる。サーバーへのドライバーのインストールも不要だし、高額な初期費用や保守費用も発生しない。
画像分類モデルの「ResNet-50」や機械翻訳モデルの「Transformer」などを実装しており、リファレンスを活用することで、すぐにでも機械学習が始められる。
ちなみに、TPUポッドが利用可能になれば、ResNet-50とTransformerで、約1日かかっていたトレーニング時間が30分未満に短縮されるようだ。
現在Cloud TPUは、ベータ版利用の申し込みをすることで、1ユニットあたり1時間6.5ドル(約690円)で利用可能となる。
参照元:Cloud TPU machine learning accelerators now available in beta/Google Cloud Platform Blog
参照元:Google Boots Up Tensor Processors On Its Cloud/The Next Platform