DAS-C01日本語 無料問題集「Amazon AWS Certified Data Analytics - Specialty (DAS-C01日本語版)」

ある会社は、オンプレミスの Apache Hadoop クラスターから Amazon EMR クラスターに移行しています。クラスターは、営業時間中にのみ実行されます。日中のクラスター障害を回避するという会社の要件により、EMR クラスターは高可用性である必要があります。各営業日の終わりにクラスターが終了しても、データは保持されている必要があります。
EMR クラスターがこれらの要件を満たすことを可能にする構成はどれですか? (3つ選んでください。)

正解:A、B、E 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
人材会社は、10 ノードの Amazon Redshift クラスターを維持して、会社のデータに対して分析クエリを実行します。Amazon Redshift クラスターには product テーブルと transactions テーブルが含まれており、両方のテーブルに product_sku 列があります。テーブルのサイズは 100 GB を超えています。クエリの大部分は、両方のテーブルで実行されます。
最適なクエリ パフォーマンスを実現するために、会社は 2 つのテーブルにどの分散スタイルを使用する必要がありますか?

ある会社は、Amazon S3 からのデータを検証して変換し、毎日 1 回バッチで Amazon RDS for MySQL にロードするために、いくつかの AWS Glue ジョブを開発しました。ETL ジョブは、DynamicFrame を使用して S3 データを読み取ります。現在、ETL 開発者は、AWS Glue ジョブが実行ごとにすべての S3 入力データを処理するため、実行ごとに増分データのみを処理するという課題に直面しています。
開発者が最小限のコーディング作業で問題を解決できるのは、どのアプローチですか?

機械会社はセンサーからデータを収集したいと考えています。データ分析スペシャリストは、ほぼリアルタイムでデータを集約し、永続的なデータ ストアにデータを保存するソリューションを実装する必要があります。データはネストされた JSON 形式で保存する必要があり、1 桁ミリ秒のレイテンシーでデータ ストアからクエリを実行する必要があります。
これらの要件を満たすソリューションはどれですか?

解説: (JPNTest メンバーにのみ表示されます)
ある企業がデータ レイクを構築しており、時系列データを持つリレーショナル データベースからデータを取り込む必要があります。この会社は、これを実現するためにマネージド サービスを使用したいと考えています。このプロセスは毎日スケジュールする必要があり、増分データのみをソースから Amazon S3 に取り込みます。
これらの要件を満たすための最も費用対効果の高いアプローチは何ですか?

解説: (JPNTest メンバーにのみ表示されます)
ある製造会社は、Amazon Connect を使用してコンタクト センターを管理し、Salesforce を使用して顧客関係管理 (CRM) データを管理します。データ エンジニアリング チームは、コンタクト センターと CRM システムから Amazon S3 上に構築されたデータ レイクにデータを取り込むためのパイプラインを構築する必要があります。
運用上のオーバーヘッドが最も少なく、データレイクでデータを収集する最も効率的な方法は何ですか?

会社は、販売データ ダッシュボードのデータ読み込み時間を改善したいと考えています。データは .csv ファイルとして収集され、日付ごとに分割された Amazon S3 バケット内に保存されています。その後、データは Amazon Redshift データ ウェアハウスにロードされ、頻繁に分析されます。データ量は 1 日あたり最大 500 GB です。
データ読み込みのパフォーマンスを向上させるソリューションはどれですか?

解説: (JPNTest メンバーにのみ表示されます)
ある小売会社は注文の請求書​​を Amazon OpenSearch Service (Amazon Elasticsearch Service) クラスターに保存します クラスターのインデックスは毎月作成されます 新しい月が始まると、前の月からのインデックスへの新しい書き込みは行われませんAmazon OpenSearch Service (Amazon Elasticsearch Service) クラスターにストレージを追加してスペース不足を回避したが、会社はコストを削減したいと考えている クラスターでのほとんどの検索は直近 3 か月のデータに対して行われているが、監査チームは古いデータに頻繁にアクセスする必要がない定期的なレポートを生成するには、最新の 3 か月のデータをクエリですぐに利用できるようにする必要がありますが、ソリューションがクラスターのコストを節約する場合、監査チームはより遅いクエリを許容できます。これらの要件を満たす最も運用効率の高いソリューションは次のうちどれですか?

大規模な大学は、在籍学生の多様性を高めるという戦略的目標を採用しています。データ分析チームは、利害関係者が過去の傾向を確認できるように、データを視覚化したダッシュボードを作成しています。すべてのアクセスは、Microsoft Active Directory を使用して認証する必要があります。転送中および保存中のすべてのデータは暗号化する必要があります。
これらの要件を満たすソリューションはどれですか?

ある企業は、AWS Lake Formation を使用してデータレイクを作成しています。データレイクに保存されるデータには機密性の高い顧客情報が含まれており、規制要件を満たすために AWS Key Management Service (AWS KMS) カスタマー管理キーを使用して保存時に暗号化する必要があります。
これらの要件を満たすために、企業はデータをデータレイクにどのように保存できるでしょうか?

データエンジニアは、AWS Glue ETL ジョブを使用して頻繁にデータを処理しています。処理されたデータは、Amazon S3 にコピーされます。ETL ジョブは 15 分ごとに実行されます。AWS Glue データカタログのパーティションは、各ジョブの完了後に自動的に更新する必要があります。これらの要件を最も費用対効果の高い方法で満たすソリューションはどれですか?

グローバルな製薬会社は、世界中のさまざまな試験施設から新薬の試験結果を受け取ります。結果は、数百万個の 1 KB サイズの JSON オブジェクトで、会社が所有する Amazon S3 バケットに送信されます。データ エンジニアリング チームは、これらのファイルを処理し、Apache Parquet 形式に変換して、データ アナリストがダッシュボード レポートを実行できるように Amazon Redshift にロードする必要があります。エンジニアリングチームは、AWS Glue を使用してオブジェクトを処理し、AWS Step Functions をプロセスオーケストレーションに使用し、Amazon CloudWatch をジョブスケジューリングに使用します。
最近、より多くのテスト機能が追加され、ファイルを処理する時間が増加しています。
データ処理時間を最も効率的に短縮するものは何ですか?

ある企業は、さまざまなソースから大規模なセンサー データのセットをネストされた JSON 形式で取り込み、Amazon S3 バケットに保存します。センサーデータは、現在 Amazon Redshift クラスターに保存されているパフォーマンス データと結合する必要があります。
基本的な SQL スキルを持つビジネス アナリストは、ダッシュボードを構築し、Amazon QuickSight でこのデータを分析する必要があります。データ エンジニアは、ビジネス アナリストが使用できるデータを準備するソリューションを構築する必要があります。データ エンジニアは JSON ファイルの構造を知りません。同社は、実装の労力を最小限に抑えたソリューションを必要としています。
これらの要件を満たすソリューションを作成するには、どの手順を組み合わせればよいでしょうか? (3 つ選択してください。)

正解:C、E、F 解答を投票する
月に一度、企業は gzip で圧縮された 100 MB の .csv ファイルを受け取ります。このファイルには 50,000 件の物件リスト レコードが含まれており、Amazon S3 Glacier に保存されています。この会社では、データ アナリストが特定のベンダーのデータのサブセットを照会する必要があります。
最も費用対効果の高いソリューションは何ですか?

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡