DAS-C01日本語無料問題集「Amazon AWS Certified Data Analytics

質問 1

ある会社は、オンプレミスの Apache Hadoop クラスターから Amazon EMR クラスターに移行しています。クラスターは、営業時間中にのみ実行されます。日中のクラスター障害を回避するという会社の要件により、EMR クラスターは高可用性である必要があります。各営業日の終わりにクラスターが終了しても、データは保持されている必要があります。
EMR クラスターがこれらの要件を満たすことを可能にする構成はどれですか? （3つ選んでください。）

（A）Apache Hive のメタストアとしての AWS Glue データカタログ

（B）ストレージ用の EMR ファイルシステム (EMRFS)

（C）ストレージ用の Hadoop 分散ファイルシステム (HDFS)

（D）Apache Hive のメタストアとしてのマスターノード上の MySQL データベース

（E）単一のアベイラビリティーゾーン内の複数のマスターノード

（F）複数のアベイラビリティーゾーン内の複数のマスターノード

正解：A、B、E 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 2

人材会社は、10 ノードの Amazon Redshift クラスターを維持して、会社のデータに対して分析クエリを実行します。Amazon Redshift クラスターには product テーブルと transactions テーブルが含まれており、両方のテーブルに product_sku 列があります。テーブルのサイズは 100 GB を超えています。クエリの大部分は、両方のテーブルで実行されます。
最適なクエリパフォーマンスを実現するために、会社は 2 つのテーブルにどの分散スタイルを使用する必要がありますか?

（A）product テーブルの ALL 分散スタイルと transactions テーブルの EVEN 分散スタイル

（B）両方のテーブルの KEY 分散スタイル

（C）product テーブルの場合は EVEN 分散スタイル、transaction テーブルの場合は KEY 分散スタイル

（D）両方のテーブルの EVEN 分散スタイル

正解：B 解答を投票する

質問 3

ある会社は、Amazon S3 からのデータを検証して変換し、毎日 1 回バッチで Amazon RDS for MySQL にロードするために、いくつかの AWS Glue ジョブを開発しました。ETL ジョブは、DynamicFrame を使用して S3 データを読み取ります。現在、ETL 開発者は、AWS Glue ジョブが実行ごとにすべての S3 入力データを処理するため、実行ごとに増分データのみを処理するという課題に直面しています。
開発者が最小限のコーディング作業で問題を解決できるのは、どのアプローチですか?

（A）ETL ジョブに、DataFrame を使用して Amazon S3 からデータを読み取らせます。

（B）AWS Glue ジョブでジョブブックマークを有効にします。

（C）ETL ジョブを実行するたびに、処理されたオブジェクトまたはデータを Amazon S3 から削除します。

（D）ETL ジョブでカスタムロジックを作成して、処理された S3 オブジェクトを追跡します。

正解：B 解答を投票する

質問 4

機械会社はセンサーからデータを収集したいと考えています。データ分析スペシャリストは、ほぼリアルタイムでデータを集約し、永続的なデータストアにデータを保存するソリューションを実装する必要があります。データはネストされた JSON 形式で保存する必要があり、1 桁ミリ秒のレイテンシーでデータストアからクエリを実行する必要があります。
これらの要件を満たすソリューションはどれですか?

（A）Amazon Kinesis Data Firehose を使用してセンサーからデータを受信します。AWS Lambda 関数を使用して、キャプチャ中にデータを集計します。データを Amazon S3 に保存します。

（B）Amazon Kinesis Data Firehose を使用してセンサーからデータを受信します。Amazon Kinesis Data Analytics を使用してデータを集計します。AWS Lambda 関数を使用して、Kinesis Data Analytics からデータを読み取り、そのデータを Amazon S3 に保存します。

（C）Amazon Kinesis Data Streams を使用してセンサーからデータを受信します。Amazon Kinesis Data Analytics を使用してストリームを読み取り、データを集約し、AWS Lambda 関数にデータを送信します。データを Amazon DynamoDB に保存するように Lambda 関数を設定します。

（D）Amazon Kinesis Data Firehose を使用してセンサーからデータを受信します。AWS Lambda 関数を使用して、キャプチャ中にデータを集計します。Kinesis Data Firehose からのデータを Amazon DynamoDB に保存します。

正解：D 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 5

ある企業がデータレイクを構築しており、時系列データを持つリレーショナルデータベースからデータを取り込む必要があります。この会社は、これを実現するためにマネージドサービスを使用したいと考えています。このプロセスは毎日スケジュールする必要があり、増分データのみをソースから Amazon S3 に取り込みます。
これらの要件を満たすための最も費用対効果の高いアプローチは何ですか?

（A）AWS Glue を使用して、JDBC ドライバーを使用してデータソースに接続します。最後に更新されたキーを Amazon DynamoDB テーブルに保存し、更新されたキーをフィルターとして使用してデータを取り込みます。

（B）AWS Glue を使用して、JDBC ドライバーを使用してデータソースに接続し、データセット全体を取り込みます。適切な Apache Spark ライブラリを使用してデータセットを比較し、デルタを見つけます。

（C）AWS Glue を使用して、JDBC ドライバーを使用してデータソースに接続します。ジョブブックマークのみを使用して増分レコードを取り込みます。

（D）AWS Glue を使用して、JDBC ドライバーを使用してデータソースに接続し、完全なデータを取り込みます。AWS DataSync を使用して、デルタのみが Amazon S3 に書き込まれるようにします。

正解：C 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 6

ある製造会社は、Amazon Connect を使用してコンタクトセンターを管理し、Salesforce を使用して顧客関係管理 (CRM) データを管理します。データエンジニアリングチームは、コンタクトセンターと CRM システムから Amazon S3 上に構築されたデータレイクにデータを取り込むためのパイプラインを構築する必要があります。
運用上のオーバーヘッドが最も少なく、データレイクでデータを収集する最も効率的な方法は何ですか?

（A）Amazon Kinesis Data Streams を使用して Amazon Connect データを取り込み、Amazon AppFlow を使用して Salesforce データを取り込みます。

（B）Amazon AppFlow を使用して Amazon Connect データを取り込み、Amazon Kinesis Data Firehose を使用して Salesforce データを取り込みます。

（C）Amazon Kinesis Data Firehose を使用して Amazon Connect データを取り込み、Amazon Kinesis Data Streams を使用して Salesforce データを取り込みます。

（D）Amazon Kinesis Data Firehose を使用して Amazon Connect データを取り込み、Amazon AppFlow を使用して Salesforce データを取り込みます。

正解：C 解答を投票する

質問 7

会社は、販売データダッシュボードのデータ読み込み時間を改善したいと考えています。データは .csv ファイルとして収集され、日付ごとに分割された Amazon S3 バケット内に保存されています。その後、データは Amazon Redshift データウェアハウスにロードされ、頻繁に分析されます。データ量は 1 日あたり最大 500 GB です。
データ読み込みのパフォーマンスを向上させるソリューションはどれですか?

（A）Amazon Kinesis Data Firehose を使用して、Amazon Redshift にデータを取り込みます。

（B）.csv ファイルを圧縮し、INSERT ステートメントを使用してデータを Amazon Redshift に取り込みます。

（C）ソートされていないキーの順序で .csv ファイルをロードし、Amazon Redshift でテーブルをバキュームします。

（D）大きな .csv ファイルを分割し、COPY コマンドを使用してデータを Amazon Redshift にロードします。

正解：D 解答を投票する

解説: (JPNTest メンバーにのみ表示されます)

質問 8

ある小売会社は注文の請求書を Amazon OpenSearch Service (Amazon Elasticsearch Service) クラスターに保存しますクラスターのインデックスは毎月作成されます新しい月が始まると、前の月からのインデックスへの新しい書き込みは行われませんAmazon OpenSearch Service (Amazon Elasticsearch Service) クラスターにストレージを追加してスペース不足を回避したが、会社はコストを削減したいと考えているクラスターでのほとんどの検索は直近 3 か月のデータに対して行われているが、監査チームは古いデータに頻繁にアクセスする必要がない定期的なレポートを生成するには、最新の 3 か月のデータをクエリですぐに利用できるようにする必要がありますが、ソリューションがクラスターのコストを節約する場合、監査チームはより遅いクエリを許容できます。これらの要件を満たす最も運用効率の高いソリューションは次のうちどれですか?

（A）手動でスナップショットを作成し、スナップショットを Amazon S3 に保存することで、3 か月以上前のインデックスをアーカイブします。監査チームがアーカイブされたデータを必要とする場合、アーカイブされたインデックスを Amazon OpenSearch Service (Amazon Elasticsearch Service) クラスターに復元します。

（B）Index State Management (ISM) を使用して 3 か月以上前のインデックスをアーカイブし、Amazon S3 Glacier にインデックスを保存するポリシーを作成します。監査チームがアーカイブデータを要求した場合、アーカイブされたインデックスを Amazon OpenSearch Service に復元します。 (Amazon Elasticsearch Service) クラスター

（C）Index State Management (ISM) を使用して 3 か月より古いインデックスをアーカイブし、インデックスを Amazon OpenSearch Service (Amazon Elasticsearch Service) UltraWarm ストレージに移行するポリシーを作成します。監査チームが古いデータを必要とする場合: UltraWarm ストレージのインデックスをホットストレージに戻す

（D）Index State Management (ISM) を使用して 3 か月以上前のインデックスをアーカイブし、インデックスを Amazon OpenSearch Service (Amazon Elasticsearch Service) UltraWarm ストレージに移行するポリシーを作成します。

正解：C 解答を投票する

質問 9

大規模な大学は、在籍学生の多様性を高めるという戦略的目標を採用しています。データ分析チームは、利害関係者が過去の傾向を確認できるように、データを視覚化したダッシュボードを作成しています。すべてのアクセスは、Microsoft Active Directory を使用して認証する必要があります。転送中および保存中のすべてのデータは暗号化する必要があります。
これらの要件を満たすソリューションはどれですか?

（A）AD Connector を使用して Active Directory を使用して認証する Amazon QuickSight Enterprise エディション。AWS KMS にインポートされた顧客提供のキーを使用するように Amazon QuickSight を設定します。

（B）SAML 2.0 とデフォルトの暗号化設定を使用して ID フェデレーションを実行するように設定された Amazon QuickSight Enterprise エディション。

（C）AD Connector を使用して Active Directory を使用して認証する Amazon QuuckSight Standard エディション。AWS KMS にインポートされた顧客提供のキーを使用するように Amazon QuickSight を設定します。

（D）SAML 2.0 を使用して ID フェデレーションを実行するように設定された Amazon QuickSight Standard エディション。およびデフォルトの暗号化設定。

正解：A 解答を投票する

質問 10

ある企業は、AWS Lake Formation を使用してデータレイクを作成しています。データレイクに保存されるデータには機密性の高い顧客情報が含まれており、規制要件を満たすために AWS Key Management Service (AWS KMS) カスタマー管理キーを使用して保存時に暗号化する必要があります。
これらの要件を満たすために、企業はデータをデータレイクにどのように保存できるでしょうか?

（A）AWS KMS (SSE-KMS) によるサーバー側暗号化を使用して、Amazon S3 バケットにデータを保存します。S3 の場所を Lake Formation に登録します。

（B）クライアント側でデータを暗号化し、暗号化されたデータを Amazon S3 バケットに保存します。S3 の場所を Lake Formation に登録します。

（C）データを Amazon S3 Glacier Flexible Retrieval ボールトバケットに保存します。S3 Glacier Flexible Retrieval ボールトを Lake Formation に登録します。

（D）暗号化された Amazon Elastic Block Store (Amazon EBS) ボリュームにデータを保存します。Amazon EBS ボリュームを Lake Formation に登録します。

正解：A 解答を投票する

質問 11

データエンジニアは、AWS Glue ETL ジョブを使用して頻繁にデータを処理しています。処理されたデータは、Amazon S3 にコピーされます。ETL ジョブは 15 分ごとに実行されます。AWS Glue データカタログのパーティションは、各ジョブの完了後に自動的に更新する必要があります。これらの要件を最も費用対効果の高い方法で満たすソリューションはどれですか?

（A）AWS Glue データカタログを使用してデータカタログを管理する ETL プロセスの AWS Glue ワークフローを定義する ETL ジョブの実行が完了したときにクローラーを開始できるトリガーをワークフロー内に定義する

（B）AWS Glue データカタログを使用してデータカタログを管理します AWS Glue ETL コードを更新して、enableUpdateCatalog および partitionKeys 引数を含めます。

（C）Apache Hive メタストアを使用してデータカタログを管理する AWS Glue ETL コードを更新して、enableUpdateCatalog および partitionKeys 引数を含めます。

（D）AWS Glue Data Catalog を使用してデータカタログを管理する AWS Glue Studio を使用して ETL ジョブを管理します。ジョブ実行中の AWS Glue データカタログへの更新をサポートする AWS Glue Studio 機能を使用します。

正解：A 解答を投票する

質問 12

グローバルな製薬会社は、世界中のさまざまな試験施設から新薬の試験結果を受け取ります。結果は、数百万個の 1 KB サイズの JSON オブジェクトで、会社が所有する Amazon S3 バケットに送信されます。データエンジニアリングチームは、これらのファイルを処理し、Apache Parquet 形式に変換して、データアナリストがダッシュボードレポートを実行できるように Amazon Redshift にロードする必要があります。エンジニアリングチームは、AWS Glue を使用してオブジェクトを処理し、AWS Step Functions をプロセスオーケストレーションに使用し、Amazon CloudWatch をジョブスケジューリングに使用します。
最近、より多くのテスト機能が追加され、ファイルを処理する時間が増加しています。
データ処理時間を最も効率的に短縮するものは何ですか?

（A）AWS Lambda を使用して、小さなファイルを大きなファイルにグループ化します。ファイルを Amazon S3 に書き戻します。AWS Glue を使用してファイルを処理し、Amazon Redshift テーブルにロードします。

（B）未加工の入力ファイルを取り込むときに、AWS Glue 動的フレームファイルのグループ化オプションを使用します。ファイルを処理し、Amazon Redshift テーブルにロードします。

（C）AWS Glue の代わりに Amazon EMR を使用して、小さな入力ファイルをグループ化します。Amazon EMR でファイルを処理し、Amazon Redshift テーブルにロードします。

（D）Amazon Redshift COPY コマンドを使用して、ファイルを Amazon S3 から Amazon Redshift テーブルに直接移動します。Amazon Redshift でファイルを処理します。

正解：A 解答を投票する

質問 13

ある企業は、さまざまなソースから大規模なセンサーデータのセットをネストされた JSON 形式で取り込み、Amazon S3 バケットに保存します。センサーデータは、現在 Amazon Redshift クラスターに保存されているパフォーマンスデータと結合する必要があります。
基本的な SQL スキルを持つビジネスアナリストは、ダッシュボードを構築し、Amazon QuickSight でこのデータを分析する必要があります。データエンジニアは、ビジネスアナリストが使用できるデータを準備するソリューションを構築する必要があります。データエンジニアは JSON ファイルの構造を知りません。同社は、実装の労力を最小限に抑えたソリューションを必要としています。
これらの要件を満たすソリューションを作成するには、どの手順を組み合わせればよいでしょうか? (3 つ選択してください。)

（A）AWS Glue ETL ジョブを使用してデータを Apache Parquet 形式に変換し、Amazon S3 に書き込みます。

（B）ApplyMapping クラスで AWS Glue ETL ジョブを使用して、データのネストを解除し、Amazon Redshift テーブルに書き込みます。

（C）QuickSight を使用して、ネイティブ Amazon Redshift テーブルを読み取る Amazon Redshift データソースを作成します。

（D）QuickSight を使用して Amazon Athena データソースを作成し、Amazon S3 の Apache Parquet ファイルを読み取ります。

（E）Regionalize クラスで AWS Glue ETL ジョブを使用して、データのネストを解除し、Amazon Redshift テーブルに書き込みます。

（F）AWS Glue クローラーを使用してデータをカタログ化します。

正解：C、E、F 解答を投票する

質問 14

月に一度、企業は gzip で圧縮された 100 MB の .csv ファイルを受け取ります。このファイルには 50,000 件の物件リストレコードが含まれており、Amazon S3 Glacier に保存されています。この会社では、データアナリストが特定のベンダーのデータのサブセットを照会する必要があります。
最も費用対効果の高いソリューションは何ですか?

（A）データを Amazon S3 にロードし、Amazon Redshift Spectrum でクエリを実行します。

（B）データを Amazon S3 にロードし、Amazon S3 Select でクエリします。

（C）データを Amazon S3 にロードし、Amazon Athena でクエリを実行します。

（D）Amazon Glacier Select を使用して、Amazon S3 Glacier から直接データをクエリします。

正解：B 解答を投票する

DAS-C01日本語無料問題集「Amazon AWS Certified Data Analytics - Specialty (DAS-C01日本語版)」

弊社を連絡する

関連リンク

トップ試験

DAS-C01日本語 無料問題集「Amazon AWS Certified Data Analytics - Specialty (DAS-C01日本語版)」

弊社を連絡する

関連リンク

トップ試験

DAS-C01日本語無料問題集「Amazon AWS Certified Data Analytics - Specialty (DAS-C01日本語版)」