5月20日に開催された『DB性能高速化入門 〜基礎から列指向、GPU活用まで〜 』に参加して、ひと枠、語らせてもらってきました。
PG-Stromでは、Apache Arrow形式のファイルをテーブルとしてアクセスできます(正確には、PG-Stromに同梱されている arrow_fdwにより実現)。GPUによる超並列処理を行う PG-Stromと列指向フォーマットであるArrowファイルの組み合わせは、非常に高速な検索、集計処理を実現します。
今回は、非常に大きな(列数の多い)テーブルを作って、Arrowファイル+PG-Strom(GPU)で処理した場合の処理速度を検証し、その結果を整理して紹介しました。
発表資料です。
speakerdeck.com
