Professional-Data-Engineer日本語 無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

Google Cloud でデータ メッシュを設計しており、複数の異なるデータ エンジニアリング チームがデータ プロダクトを構築しています。一般的なデータ キュレーションの設計パターンは、ファイルを Cloud Storage に格納し、元データを Cloud Storage と BigQuery データセットに変換し、最終的にキュレートされたデータ プロダクトを BigQuery データセットに保存するというものです。各チームがデータ プロダクトの構築に必要なアセットのみにアクセスできるように、Dataplex を構成する必要があります。また、チームがキュレートされたデータ プロダクトを簡単に共有できるようにする必要があります。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
タイムスタンプと ID 列の WHERE 句を使用して BigQuery テーブルをフィルタリングするクエリがあります。bq query -dry_run を使用すると、タイムスタンプと ID のフィルタが全体のデータのごく一部を選択しているにもかかわらず、クエリがテーブルのフルスキャンをトリガーすることがわかります。既存の SQL クエリへの変更を最小限に抑えて、BigQuery によってスキャンされるデータの量を削減したいと考えています。どうすればよいでしょうか。

オープンソース ベースのツールと Google Kubernetes Engine (GKE) を使用して、ワークフロー パイプラインのスケジューリングを実装しています。タスクを簡素化および自動化するために、Google マネージド サービスを使用したいと考えています。また、共有 VPC ネットワークの考慮事項にも対応したいと考えています。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
データセットに個々の人物の行と、生年月日、国、収入の列が含まれている場合、連続した列はいくつあり、カテゴリ別の列はいくつありますか?

解説: (JPNTest メンバーにのみ表示されます)
Cloud Dataproc でサポートされているジョブタイプは次のどれですか (3 つの回答を選択)。

正解:A、C、D 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
データ ウェアハウスを BigQuery に移行しています。すべてのデータをデータセット内のテーブルに移行しました。組織内の複数のユーザーがデータを使用します。ユーザーには、チーム メンバーシップに基づいて特定のテーブルのみが表示されるようにする必要があります。ユーザー権限をどのように設定すればよいでしょうか。

パブリック HTTPS エンドポイントから Cloud Storage に大量のファイルを移行しています。ファイルは、署名付き URL を使用して不正アクセスから保護されています。オブジェクト URL のリストを含む TSV ファイルを作成し、Storage Transfer Service を使用して転送ジョブを開始しました。ジョブが長時間実行され、最終的に失敗したことに気付きました。転送ジョブのログを確認すると、ジョブはある時点まで正常に実行されていたが、残りのファイルで HTTP 403 エラーが発生したため失敗したことがわかります。ソース システムに変更がないことを確認しました。移行プロセスを再開するには、問題を修正する必要があります。どうすればよいですか?

解説: (JPNTest メンバーにのみ表示されます)
Google BigQuery で、ほぼリアルタイムで毎分 10,000 件のメッセージの速度でソーシャル メディアの投稿を保存および分析する必要があります。最初に、個々の投稿にストリーミング挿入を使用するようにアプリケーションを設計します。アプリケーションは、ストリーミング挿入の直後にデータの集計も実行します。ストリーミング挿入後のクエリは強力な一貫性を示さず、クエリからのレポートで実行中のデータが欠落する可能性があることがわかりました。アプリケーション設計をどのように調整すればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
あなたは配送会社で働いています。配送センターには、荷物が配送ラインに沿って移動し、適切にルーティングされる場所があります。この会社は、配送ラインにカメラを追加して、輸送中の荷物の目に見える損傷を検出して追跡したいと考えています。損傷した荷物の検出を自動化し、荷物の輸送中にリアルタイムで人間による確認のためにフラグを立てる方法を作成する必要があります。どのソリューションを選択すべきでしょうか。

ストリーミング Cloud Dataflow パイプラインを運用しています。エンジニアは、異なるウィンドウ アルゴリズムとトリガー戦略を備えた新しいバージョンのパイプラインを持っています。実行中のパイプラインを新しいバージョンに更新したいと考えています。更新中にデータが失われないようにする必要があります。どうすればよいでしょうか。

あなたの会社では、Google Cloud Dataflow で学習アルゴリズムのデータ前処理を行っています。このステップでは多数のデータログが生成されており、チームはそれを分析したいと考えています。キャンペーンの動的な性質により、データは毎時間指数関数的に増加しています。
データ サイエンティストは、ログ内の新しい主要な特徴のデータを読み取るために次のコードを作成しました。
BigQueryIO.読み取り
.named("ログデータの読み取り")
.from("clouddataflow-readonly:samples.log_data")
このデータ読み取りのパフォーマンスを改善したいのですが、どうすればよいでしょうか?

あなたの会社は規制の厳しい業界に属しています。要件の 1 つは、個々のユーザーが業務を遂行するために必要な最小限の情報のみにアクセスできるようにすることです。この要件を Google BigQuery で強制したいと考えています。どの 3 つのアプローチを採用できますか? (3 つ選択してください)。

正解:C、E、F 解答を投票する
運用環境に Standard Tier Memorystore for Redis インスタンスをデプロイしています。最も正確な災害復旧状況で Redis インスタンスのフェイルオーバーをシミュレートし、フェイルオーバーが運用データに影響を与えないことを確認する必要があります。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
次のどれが、Dataflow がサポートする 3 つの主要なトリガー タイプに該当しませんか?

解説: (JPNTest メンバーにのみ表示されます)
「customers」という名前の BigQuery データセットがあります。すべてのテーブルは、「gdpr」という名前のデータ カタログ タグ テンプレートを使用してタグ付けされます。テンプレートには、ブール値を持つ「機密データあり」という必須フィールドが 1 つ含まれています。すべての従業員は、データセット内で「機密データあり」フィールドが true または false であるテーブルを簡単な検索で見つけられる必要があります。ただし、「機密データあり」フィールドが true であるテーブル内のデータは、人事 (HR) グループのみが表示できるようにする必要があります。すべての従業員グループに、データセットの bigquery.metadataViewer ロールと bigquery.connectionUser ロールを付与します。構成のオーバーヘッドを最小限に抑える必要があります。次に何をすべきでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
データ ウェアハウスを Google Cloud に移行し、オンプレミスのデータセンターを廃止します。これは会社の優先事項であるため、クラウドへの初期データ ロード用に帯域幅が利用可能になることはわかっています。転送されるファイルの数は多くありませんが、各ファイルは 90 GB です。さらに、トランザクション システムで Google Cloud のウェアハウスをリアルタイムで継続的に更新する必要があります。データを移行し、ウェアハウスへの書き込みが継続されるようにするには、どのようなツールを使用すればよいでしょうか。

Cloud Dataflow ストリーミング パイプラインを操作しています。パイプラインは、一定期間内に Cloud Pub/Sub サブスクリプション ソースからのイベントを集約し、集約結果を Cloud Storage バケットにシンクします。ソースのスループットは一定です。パイプラインの動作に関するアラートを Cloud Stackdriver でモニタリングして、パイプラインがデータを処理していることを確認したいとします。どの Stackdriver アラートを作成する必要がありますか。

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡