3月にGoogle Cloud Professional Data Engineer を受験しました。2024年1月30日からPDE日本語試験のバージョンが変わっていると聞きますが、自分の受験対策時にも情報が乏しかったので所感をメモします。全体的に公式サイト や UDEMYの模擬試験とのギャップが大きい印象です。大規模な運用に関する出題の比率が上がり、機械学習のモデル・評価に関する出題が無くなっているので、ここを得点源にしている方は要注意です。模擬試験問題では見なじみが無い出題範囲として、以下2項目の対策が有効と思います。

  • Google Cloud Dataplex
    • データレイクの設計と管理 (BigQueryとの統合など)
    • ガバナンスとコンプライアンス(共有方法など)
  • パイプラインの開発・監視
    • 適切な設計(push/pull, 集計ウィンドウの選択など)
    • 不具合箇所の特定(処理時間、ボトルネック解消など)
    • コンテナの運用(自動スケーリング、バージョン管理など)

他にも、クエリの高速化などパフォーマンス向上に関する出題が増えたように感じます。
結果的には、1回目の受験で合格したので、前バージョンの対策が十分も効果があるはずです。