GPU(NVIDIA V100)とのベンチマーク比較。上の表は、GPUが得意とする大量データの一括処理という形になるように、GPU側のパッチサイズを256にしてあり、いわば「GPU側に有利な設定」で実行した結果だが、この場合でも実効スループットはほぼ同等、消費電力量は1/6で済むという結果になっている。下は、音声のリアルタイム処理というワークロードの特性に合わせてレイテンシを最小化するためにパッチサイズを1にそろえた場合の結果。この場合は実効スループット、レイテンシ共にFPGAが上回るという。なお、山崎氏はこの結果の解釈として「FPGAがGPUよりも高速だと言いたいわけではなく、ワークロードの特性として“FPGAに向く処理”というものが存在するということを示したもの」としている

GPU(NVIDIA V100)とのベンチマーク比較。上の表は、GPUが得意とする大量データの一括処理という形になるように、GPU側のパッチサイズを256にしてあり、いわば「GPU側に有利な設定」で実行した結果だが、この場合でも実効スループットはほぼ同等、消費電力量は1/6で済むという結果になっている。下は、音声のリアルタイム処理というワークロードの特性に合わせてレイテンシを最小化するためにパッチサイズを1にそろえた場合の結果。この場合は実効スループット、レイテンシ共にFPGAが上回るという。なお、山崎氏はこの結果の解釈として「FPGAがGPUよりも高速だと言いたいわけではなく、ワークロードの特性として“FPGAに向く処理”というものが存在するということを示したもの」としている