Professional-Data-Engineer日本語 無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

MySQL を使用して Cloud SQL をデプロイする予定です。ゾーン障害が発生した場合に高可用性を確保する必要があります。どうすればよいでしょうか。

Google の Dataflow SDK を使用して、以下に示すような顧客データを分析する予定です。プロジェクトの要件は、データ ソースから顧客名のみを抽出し、出力 PCollection に書き込むことです。
トム、555 X 通り
ティム、553 Yストリート
サム、111 Z ストリート
上記のデータ処理要件に最適な操作はどれですか?

解説: (JPNTest メンバーにのみ表示されます)
あなたは、オンライン販売機能を Google Home などのさまざまな家庭内アシスタントと統合したいと考えている小売業者です。顧客の音声コマンドを解釈し、バックエンド システムに注文を発行する必要があります。どのソリューションを選択すべきでしょうか?

ニューラル ネットワークがトレーニング データセットから学習するときに調整される数値はどれですか (回答を 2 つ選択してください)。

正解:C、D 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
あなたはデータ ガバナンス チームに所属しており、リソースをデプロイするためのセキュリティ要件を実装しています。リソースが europe-west 3 リージョンのみに制限されていることを確認する必要があります。Google が推奨するプラクティスに従う必要があります。どうすればよいですか?

解説: (JPNTest メンバーにのみ表示されます)
オンプレミスに、ウェブ アプリケーション ログを含むトピックを含む Apache Kafka クラスタがあります。BigQuery と Cloud Storage で分析するために、データを Google Cloud に複製する必要があります。Kafka Connect プラグインのデプロイを回避するには、ミラーリングによる複製が推奨されます。
何をすべきでしょうか?

Google Kubernetes Engine (GKE) で実行されるデータ処理アプリケーションがあります。コンテナは、コンテナ レジストリから利用可能な最新の構成で起動する必要があります。GKE ノードには、GPU、ローカル SSD、8 Gbps の帯域幅が必要です。データ処理インフラストラクチャを効率的にプロビジョニングし、デプロイメント プロセスを管理したいと考えています。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
あなたは BigQuery 管理者で、Looker などのツールでアドホック クエリやダウンストリーム レポートを実行するデータ コンシューマーのチームをサポートしています。すべてのデータとユーザーは、単一の組織プロジェクトにまとめられています。最近、クエリ結果が遅くなっていることに気付き、どこで速度低下が発生しているかをトラブルシューティングしたいと考えています。ユーザーがジョブを実行すると、ジョブのキューイングまたはスロットの競合が発生し、結果へのアクセスが遅くなるのではないかと考えています。クエリ ジョブの情報を調査し、パフォーマンスが影響を受けている場所を特定する必要があります。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
Dataflow はバッチ データ パイプラインまたはストリーミング データ パイプラインを処理しますか?

解説: (JPNTest メンバーにのみ表示されます)
あなたの会社は、オンプレミスのデータ ウェアハウス ソリューションを BigQuery に移行しています。既存のデータ ウェアハウスでは、トリガー ベースの変更データ キャプチャ (CDC) を使用して、トランザクション データベース ソースからの毎日の更新を適用しています。あなたの会社は、BigQuery を使用して CDC の処理を​​改善し、データ ウェアハウスのパフォーマンスを最適化したいと考えています。ソース システムの変更は、tog ベースの CDC ストリームを使用してほぼリアルタイムでクエリに使用できる必要があります。BigQuery レポート テーブルの変更が、最小限のレイテンシと削減されたオーバーヘッドで利用できるようにする必要があります。何をすべきでしょうか。2 つの回答を選択してください。

正解:C、D 解答を投票する
Cloud Dataproc では、_____ 課金により実際に使用した分だけ料金が請求されます。

解説: (JPNTest メンバーにのみ表示されます)
次の要件を満たす運用チーム向けの視覚化を作成する必要があります。
テレメトリには、過去 6 週間の 50,000 のインストールすべてからのデータが含まれている必要があります (1 分ごとにサンプリング)。レポートはライブ データから 3 時間以上遅延してはなりません。
実用的なレポートには、最適ではないリンクのみが表示されます。
最適ではないリンクのほとんどは、一番上に並べる必要があります。
最適ではないリンクは、地域別にグループ化してフィルタリングできます。
レポートをロードするためのユーザー応答時間は 5 秒未満である必要があります。
過去 6 週間のデータを保存するデータ ソースを作成し、複数の日付範囲、異なる地理的地域、固有のインストール タイプを閲覧者が確認できる視覚化を作成します。視覚化に変更を加えることなく、常に最新のデータを表示します。毎月新しい視覚化を作成して更新することは避けたいと考えています。どうすればよいでしょうか。

大量のクリックストリームイベントデータ用のBigQueryテーブルを設計しています。データアナリストチームは、特定のイベント日付範囲でクエリを実行し、ユーザーID(UUID)でフィルタリングすることが最も多いでしょう。クエリのコストとパフォーマンスを考慮して、テーブル構造を最適化したいと考えています。どうすればよいでしょうか?

解説: (JPNTest メンバーにのみ表示されます)
生放送のテレビ番組で、視聴者に携帯電話を使った投票をお願いしています。このイベントでは、3分間で大量のデータが生成されます。あなたは投票システムの再構築*を担当し、プラットフォームが負荷に対応し、すべての投票が処理されるよう保証する必要があります。部分的な結果を表示し、「投票受付中」と表示する必要があります。
投票後、コストを最適化するために、投票を正確に1回だけ数える必要があります。どうすればいいでしょうか?

プライベートユーザーデータを含む機密プロジェクトに取り組んでいます
a. 社内で作業を行うために、Google Cloud Platform にプロジェクトを設定しました。外部コンサルタントが、プロジェクトの Google Cloud Dataflow パイプラインで複雑な変換のコーディングを支援します。ユーザーのプライバシーをどのように維持すればよいでしょうか。

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡