Professional-Data-Engineer日本語無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

質問 1

MySQL を使用して Cloud SQL をデプロイする予定です。ゾーン障害が発生した場合に高可用性を確保する必要があります。どうすればよいでしょうか。

（A）リージョン内に Cloud SQL インスタンスを作成し、同じリージョン内の Cloud Storage バケットへの自動バックアップを構成します。

（B）あるゾーンに Cloud SQL インスタンスを作成し、別のリージョンのゾーンに外部読み取りレプリカを構成します。

（C）1 つのゾーンに Cloud SQL インスタンスを作成し、同じリージョン内の別のゾーンに読み取りレプリカを作成します。

（D）1 つのゾーンに Cloud SQL インスタンスを作成し、同じリージョン内の別のゾーンにフェイルオーバーレプリカを作成します。

正解：B 解答を投票する

質問 2

Google の Dataflow SDK を使用して、以下に示すような顧客データを分析する予定です。プロジェクトの要件は、データソースから顧客名のみを抽出し、出力 PCollection に書き込むことです。
トム、555 X 通り
ティム、553 Yストリート
サム、111 Z ストリート
上記のデータ処理要件に最適な操作はどれですか?

（A）シンクAPI

（B）パルド

（C）ソースAPI

（D）データ抽出

正解：B 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 3

あなたは、オンライン販売機能を Google Home などのさまざまな家庭内アシスタントと統合したいと考えている小売業者です。顧客の音声コマンドを解釈し、バックエンドシステムに注文を発行する必要があります。どのソリューションを選択すべきでしょうか?

（A）Cloud AutoML 自然言語

（B）クラウド音声テキスト変換 API

（C）クラウド自然言語 API

（D）Dialogflow エンタープライズエディション

正解：D 解答を投票する

質問 4

ニューラルネットワークがトレーニングデータセットから学習するときに調整される数値はどれですか (回答を 2 つ選択してください)。

（A）入力値

（B）連続した特徴

（C）重み

（D）偏見

正解：C、D 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 5

あなたはデータガバナンスチームに所属しており、リソースをデプロイするためのセキュリティ要件を実装しています。リソースが europe-west 3 リージョンのみに制限されていることを確認する必要があります。Google が推奨するプラクティスに従う必要があります。どうすればよいですか?

（A）制約/gcp. resourceLocations 組織ポリシー制約を in:eu-locations に設定します。

（B）Terraform を使用してリソースをデプロイし、変数検証ルールを実装して、すべてのリソースのリージョンが europe-west3 リージョンに設定されていることを確認します。

（C）制約/gcp. resourceLocations 組織ポリシー制約を in: europe-west3-locations に設定します。

（D）作成されたすべてのリソースを監視し、europe-west3 リージョン外で作成されたリソースを自動的に破棄する Cloud Functions を作成します。

正解：C 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 6

オンプレミスに、ウェブアプリケーションログを含むトピックを含む Apache Kafka クラスタがあります。BigQuery と Cloud Storage で分析するために、データを Google Cloud に複製する必要があります。Kafka Connect プラグインのデプロイを回避するには、ミラーリングによる複製が推奨されます。
何をすべきでしょうか?

（A）PubSub Kafka コネクタをオンプレミスの Kafka クラスタにデプロイし、PubSub をソースコネクタとして構成します。Dataflow ジョブを使用して PubSub から読み取り、GCS に書き込みます。

（B）PubSub Kafka コネクタをオンプレミスの Kafka クラスタにデプロイし、PubSub をシンクコネクタとして構成します。Dataflow ジョブを使用して PubSub から読み取り、GCS に書き込みます。

（C）PubSub Kafka コネクタをシンクコネクタとして構成して、GCE VM インスタンスに Kafka クラスタをデプロイします。Dataproc クラスタまたは Dataflow ジョブを使用して、Kafka から読み取り、GCS に書き込みます。

（D）GCE VM インスタンスに Kafka クラスタをデプロイします。オンプレミスクラスタを構成して、GCE で実行されているクラスタにトピックをミラーリングします。Dataproc クラスタまたは Dataflow ジョブを使用して、Kafka から読み取り、GCS に書き込みます。

正解：D 解答を投票する

質問 7

Google Kubernetes Engine (GKE) で実行されるデータ処理アプリケーションがあります。コンテナは、コンテナレジストリから利用可能な最新の構成で起動する必要があります。GKE ノードには、GPU、ローカル SSD、8 Gbps の帯域幅が必要です。データ処理インフラストラクチャを効率的にプロビジョニングし、デプロイメントプロセスを管理したいと考えています。どうすればよいでしょうか。

（A）Dataflow を使用してデータパイプラインをプロビジョニングし、Cloud Scheduler を使用してジョブを実行します。

（B）Compute Engine の起動スクリプトを使用してコンテナイメージをプルし、global コマンドを使用してインフラストラクチャをプロビジョニングします。

（C）GKE を使用してコンテナを自動スケーリングし、globud コマンドを使用してインフラストラクチャをプロビジョニングします。

（D）Cloud Build を使用して、Terraform ビルドを使用したジョブをスケジュールし、インフラストラクチャをプロビジョニングして、最新のコンテナイメージで起動します。

正解：D 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 8

あなたは BigQuery 管理者で、Looker などのツールでアドホッククエリやダウンストリームレポートを実行するデータコンシューマーのチームをサポートしています。すべてのデータとユーザーは、単一の組織プロジェクトにまとめられています。最近、クエリ結果が遅くなっていることに気付き、どこで速度低下が発生しているかをトラブルシューティングしたいと考えています。ユーザーがジョブを実行すると、ジョブのキューイングまたはスロットの競合が発生し、結果へのアクセスが遅くなるのではないかと考えています。クエリジョブの情報を調査し、パフォーマンスが影響を受けている場所を特定する必要があります。どうすればよいでしょうか。

（A）Cloud Logging を使用して、ユーザーまたは下流の消費者がタグ付けされたリソースに対するアクセス権を変更または削除しているかどうかを判断します。

（B）プロジェクトのスロット予約を使用して、十分なクエリ処理能力を確保し、利用可能なスロットを低速のクエリに割り当てることができるようにします。

（C）利用可能な管理リソースチャートを使用して、スロットの使用状況とジョブの経時的なパフォーマンスを確認します。INFORMATION_SCHEMA でクエリを実行して、クエリのパフォーマンスを確認します。

（D）Cloud Monitoring を使用して BigQuery 指標を表示し、特定の割合のスロットが使用されたことを通知するアラートを設定します。

正解：C 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 9

Dataflow はバッチデータパイプラインまたはストリーミングデータパイプラインを処理しますか?

（A）バッチデータパイプラインのみ

（B）上記のいずれでもない

（C）ストリーミングデータパイプラインのみ

（D）バッチデータパイプラインとストリーミングデータパイプラインの両方

正解：D 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 10

あなたの会社は、オンプレミスのデータウェアハウスソリューションを BigQuery に移行しています。既存のデータウェアハウスでは、トリガーベースの変更データキャプチャ (CDC) を使用して、トランザクションデータベースソースからの毎日の更新を適用しています。あなたの会社は、BigQuery を使用して CDC の処理を改善し、データウェアハウスのパフォーマンスを最適化したいと考えています。ソースシステムの変更は、tog ベースの CDC ストリームを使用してほぼリアルタイムでクエリに使用できる必要があります。BigQuery レポートテーブルの変更が、最小限のレイテンシと削減されたオーバーヘッドで利用できるようにする必要があります。何をすべきでしょうか。2 つの回答を選択してください。

（A）新しいCDCレコードと対応する操作タイプをステージングテーブルにリアルタイムで挿入します。

（B）DML INSERT、UPDATE、または DELETE を実行して、レポートテーブル内の各 CDC レコードをリアルタイムで複製します。

（C）新しい CDC レコードと対応する操作タイプをレポートテーブルにリアルタイムで挿入し、マテリアライズドビューを使用して各一意のレコードの現在のバージョンのみを公開します。

（D）レポートテーブルから古いレコードを定期的に削除する
定期的にDML MERGEを使用して、レポートテーブルでDML INSERT、UPDATE、およびDELETE操作を同時に実行します。

正解：C、D 解答を投票する

質問 11

Cloud Dataproc では、_____ 課金により実際に使用した分だけ料金が請求されます。

（A）月ごと

（B）週ごと

（C）分単位

（D）時間ごと

正解：C 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 12

次の要件を満たす運用チーム向けの視覚化を作成する必要があります。
テレメトリには、過去 6 週間の 50,000 のインストールすべてからのデータが含まれている必要があります (1 分ごとにサンプリング)。レポートはライブデータから 3 時間以上遅延してはなりません。
実用的なレポートには、最適ではないリンクのみが表示されます。
最適ではないリンクのほとんどは、一番上に並べる必要があります。
最適ではないリンクは、地域別にグループ化してフィルタリングできます。
レポートをロードするためのユーザー応答時間は 5 秒未満である必要があります。
過去 6 週間のデータを保存するデータソースを作成し、複数の日付範囲、異なる地理的地域、固有のインストールタイプを閲覧者が確認できる視覚化を作成します。視覚化に変更を加えることなく、常に最新のデータを表示します。毎月新しい視覚化を作成して更新することは避けたいと考えています。どうすればよいでしょうか。

（A）データをスプレッドシートにエクスポートし、条件の可能な組み合わせごとに 1 つずつグラフと表のシリーズを作成し、複数のタブに分散します。

（B）現在のデータを調べ、値の選択を可能にする基準フィルターにバインドされた一般化されたグラフと表の小さなセットを作成します。

（C）現在のデータを調べて、条件の可能な組み合わせごとに 1 つずつ、一連のグラフと表を作成します。

（D）データをリレーショナルデータベーステーブルに読み込み、すべての行をクエリし、各条件でデータを要約し、Google Charts および Visualization API を使用して結果をレンダリングする Google App Engine アプリケーションを作成します。

正解：B 解答を投票する

質問 13

大量のクリックストリームイベントデータ用のBigQueryテーブルを設計しています。データアナリストチームは、特定のイベント日付範囲でクエリを実行し、ユーザーID（UUID）でフィルタリングすることが最も多いでしょう。クエリのコストとパフォーマンスを考慮して、テーブル構造を最適化したいと考えています。どうすればよいでしょうか？

（A）テーブルをユーザー ID 列でパーティション化し、イベント日付列でクラスター化します。

（B）イベントの日付とユーザー ID 列の両方でテーブルをクラスター化します。

（C）イベント日付列でテーブルをパーティション化し、ユーザー ID 列でテーブルをクラスター化します。

（D）取り込み時間パーティション分割テーブルを作成し、ユーザー ID 列でクラスター化します。

正解：C 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 14

生放送のテレビ番組で、視聴者に携帯電話を使った投票をお願いしています。このイベントでは、3分間で大量のデータが生成されます。あなたは投票システムの再構築*を担当し、プラットフォームが負荷に対応し、すべての投票が処理されるよう保証する必要があります。部分的な結果を表示し、「投票受付中」と表示する必要があります。
投票後、コストを最適化するために、投票を正確に1回だけ数える必要があります。どうすればいいでしょうか？

（A）Pub/Sub トピックに投票を書き込み、Cloud Functions でサブスクライブして BigQuery に投票を書き込む

（B）投票を Pub/Sub トポロジに書き込み、Dataflow パイプラインを介して Bigtable と BigQuery の両方に書き込みます。Bigtable にクエリを実行してリアルタイムの結果を取得し、BigQuery にクエリを実行して後で分析します。投票が終了したら、Bigtable インスタンスをシャットダウンします。高可用性 (HA) 構成と複数のリードレプリカを備えた Cloud SQL for PostgreSQL データベースを作成します。

（C）高可用性（HA）構成の Memorystore インスタンスを作成する

正解：B 解答を投票する

質問 15

プライベートユーザーデータを含む機密プロジェクトに取り組んでいます
a. 社内で作業を行うために、Google Cloud Platform にプロジェクトを設定しました。外部コンサルタントが、プロジェクトの Google Cloud Dataflow パイプラインで複雑な変換のコーディングを支援します。ユーザーのプライバシーをどのように維持すればよいでしょうか。

（A）コンサルタントにプロジェクトの Cloud Dataflow 開発者ロールを付与します。

（B）コンサルタントにプロジェクトの閲覧者ロールを付与します。

（C）コンサルタントが別のプロジェクトで作業できるように、匿名化されたデータのサンプルを作成します。

（D）サービスアカウントを作成し、コンサルタントがそのアカウントを使用してログオンできるようにします。

正解：D 解答を投票する

Professional-Data-Engineer日本語無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

弊社を連絡する

関連リンク

トップ試験

Professional-Data-Engineer日本語 無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

弊社を連絡する

関連リンク

トップ試験

Professional-Data-Engineer日本語無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」