Google Cloud認定に新試験Associate Data Practitionerが追加されたので試験概要を調べてみた

Google Cloud認定のアソシエイトレベルにまた新しい試験が追加されました。


またProfessional Cloud Architectのリニューアルもあるようです。


Webassessorを見る限り11/6以降から受験予約ができるようです。
ちなみに試験の受け方が変わったようでWebassessorへの直接ログインはできなくなりCertMetricsを経由してログインする形になっています。

試験はまだベータ版なので英語のみ70問2.5時間のボリュームで受験には体力がいりそうです。
その代わり落ちても受験回数のペナルティには含まれないようです。

試験ガイドGoogle Cloud Skills Boostのラーニングパスも用意されています。
また試験ガイドをGeminiで日本語翻訳してみました。


アソシエイト データ プラクティショナーは、Google Cloud 上のデータを保護および管理します。この個人は、データの取り込み、変換、パイプライン管理、分析、機械学習、視覚化などのタスクに Google Cloud データ サービスを使用した経験があります。受験者は、サービスとしてのインフラストラクチャ (IaaS)、サービスとしてのプラットフォーム (PaaS)、サービスとしてのソフトウェア (SaaS) などのクラウド コンピューティングの概念を基本的に理解しています。

セクション 1: データの準備と取り込み (試験の約 30%)

1.1 データを準備および処理します。考慮事項は次のとおりです。

  • さまざまなデータ操作方法 (ETL、ELT、ETLT など) を区別する
  • 適切なデータ転送ツール (Storage Transfer Service、Transfer Appliance など) を選択する
  • データ品質を評価する
  • データ クリーニングを実行する (Cloud Data Fusion、BigQuery、SQL、Dataflow など)

1.2 適切な Google Cloud ストレージ システムにデータを抽出およびロードします。考慮事項は次のとおりです。

  • データの形式を区別する (CSV、JSON、Apache Parquet、Apache Avro、構造化データベース テーブルなど)
  • 適切な抽出ツールを選択する (Dataflow、BigQuery Data Transfer Service、Database Migration Service、Cloud Data Fusion など)
  • 適切なストレージ ソリューションを選択する (Cloud Storage、BigQuery、Cloud SQL、Firestore、Bigtable、Spanner、AlloyDB など)
    • 適切なデータ ストレージ ロケーション タイプを選択する (リージョン、デュアルリージョン、マルチリージョン、ゾーンなど)
    • ユースケースを構造化データ、非構造化データ、または半構造化データの要件に分類する
  • 適切なツールを使用して Google Cloud ストレージ システムにデータをロードする (gcloud および BQ CLI、Storage Transfer Service、BigQuery Data Transfer Service、クライアント ライブラリなど)

セクション 2: データ分析とプレゼンテーション (試験の約 27%)

2.1 BigQuery と Jupyter ノートブックを使用して、データの傾向、パターン、洞察を特定します。考慮事項は次のとおりです。

  • BigQuery で SQL クエリを定義および実行して、レポートを生成し、重要な洞察を抽出する
  • Jupyter ノートブックを使用してデータを分析および視覚化する (Colab Enterprise など)
  • データを分析してビジネス上の質問に答える

2.2 ビジネス要件に基づいて Looker でデータを視覚化し、ダッシュボードを作成します。考慮事項は次のとおりです。

  • ダッシュボードを作成、変更、共有してビジネス上の質問に答える
  • さまざまな分析ユースケースについて Looker と Looker Studio を比較する
  • シンプルな LookML パラメータを操作してデータモデルを変更する

2.3 ML モデルを定義、トレーニング、評価、使用します。考慮事項は次のとおりです。

  • BigQuery ML と AutoML を使用してモデルを開発するための ML ユースケースを特定する
  • BigQuery でリモート接続を使用して、事前トレーニング済みの Google 大規模言語モデル (LLM) を使用する
  • 標準の ML プロジェクトを計画する (データ収集、モデル トレーニング、モデル評価、予測など)
  • SQL を実行して BigQuery ML を使用してモデルを作成、トレーニング、評価する
  • BigQuery ML モデルを使用して推論を実行する
  • Model Registry でモデルを整理する

セクション 3: データ パイプライン オーケストレーション (試験の約 18%)

3.1 シンプルなデータ パイプラインを設計および実装します。考慮事項は次のとおりです。

  • ビジネス要件に基づいてデータ変換ツール (Dataproc、Dataflow、Cloud Data Fusion、Cloud Composer、Dataform など) を選択する
  • ELT と ETL のユースケースを評価する
  • 基本的な変換パイプラインを実装するために必要な製品を選択する

3.2 基本的なデータ処理タスクのスケジュール、自動化、監視を行います。考慮事項は次のとおりです。

  • スケジュールされたクエリを作成および管理する (BigQuery、Cloud Scheduler、Cloud Composer など)
  • Dataflow ジョブ UI を使用して Dataflow パイプラインの進行状況を監視する
  • Cloud Logging と Cloud Monitoring でログを確認および分析する
  • ビジネス要件に基づいてデータ オーケストレーション ソリューション (Cloud Composer、スケジュールされたクエリ、Dataproc Workflow Templates、Workflows など) を選択する
  • Pub/Sub から BigQuery へのイベント駆動型データ取り込みのユースケースを特定する
  • イベント駆動型パイプライン (Dataform、Dataflow、Cloud Functions、Cloud Run、Cloud Composer) で Eventarc トリガーを使用する

セクション 4: データ管理 (試験の約 25%)

4.1 アクセス制御とガバナンスを構成します。考慮事項は次のとおりです。

  • ID およびアクセス管理 (IAM) を使用して最小限の特権アクセスの原則を確立する
    • データ サービス (BigQuery、Cloud Storage など) の基本的な役割、定義済みの役割、権限を区別する
  • Cloud Storage のアクセス制御方法を比較する (パブリック アクセスまたはプライベート アクセス、均一アクセスなど)
  • Analytics Hub を使用してデータを共有するタイミングを決定する

4.2 ライフサイクル管理を構成します。考慮事項は次のとおりです。

  • データ アクセスの頻度と保持要件に基づいて適切な Cloud Storage クラスを決定する
  • 指定された期間後にオブジェクトを削除するルールを構成して、不要なデータを自動的に削除し、ストレージ費用を削減する (BigQuery、Cloud Storage など)
  • ビジネス要件に基づいてデータをアーカイブするための Google Cloud サービスを評価する

4.3 Cloud Storage および Cloud SQL のデータの高可用性と障害復旧戦略を特定します。考慮事項は次のとおりです。

  • Google マネージド サービスとして提供されるバックアップおよびリカバリ ソリューションを比較する
  • レプリケーションを使用するタイミングを決定する
  • データ冗長性のためのプライマリおよびセカンダリ データ ストレージ ロケーション タイプ (リージョン、デュアルリージョン、マルチリージョン、ゾーンなど) を区別する

4.4 セキュリティ対策を適用し、データ プライバシー規制への準拠を確保します。考慮事項は次のとおりです。

  • 顧客管理の暗号鍵 (CMEK)、顧客提供の暗号鍵 (CSEK)、Google 管理の暗号鍵 (GMEK) のユースケースを特定する
  • 暗号鍵を管理するための Cloud Key Management Service (Cloud KMS) の役割を理解する
  • 転送中の暗号化と保存時の暗号化の違いを特定する

上位資格に相当するであろうProfessional Data Engineerの試験ガイドと比べるとよりオペレーション的な部分を聞かれそうな印象を受けます。
Lookerが試験範囲に入っているのも違うところですね。

受ける場合はProfessional Data Engineerの下位試験だからと言って油断せず臨んだ方がいいでしょう。

AWSもプラクティショナー、アソシエイトレベルの試験が今年増えていますが、Google Cloudもアソシエイトレベルを増やしてきました。
先月もAssociate Google Workspace Administratorが追加されたので次は生成AIの資格が登場しそうな予感?