
[2023年06月24日] 心強いDAS-C01日本語のPDF問題集はDAS-C01日本語問題
正真正銘のDAS-C01日本語問題集で無料PDF問題で合格させる
質問 # 91
ある企業は、全国の高速道路の有料サービスを運営しており、使用パターンを理解するために使用されるデータを収集しています。アナリストは、ほぼリアルタイムでトラフィック レポートを実行する機能を要求しました。同社は、すべてのデータを Amazon Redshift クラスターにロードし、特定の料金所の有料トラフィックが指定されたしきい値を満たさない場合に運用担当者に警告する取り込みパイプラインの構築に関心を持っています。ステーション データと対応するしきい値は、Amazon S3 に保存されます。
これらの要件を満たす最も効率的な方法はどれですか?
- A. Amazon Kinesis Data Firehose を使用してデータを収集し、Amazon Redshift と Amazon Kinesis Data Analytics に同時に配信します。Kinesis Data Analytics を使用して、Amazon S3 に保存されている情報に基づいて、アプリケーション内ストリームとしてテーブルに保存されているステーションのしきい値と車両の数を比較します。しきい値に達しない場合に運用担当者に警告する Amazon Simple Queue Service (Amazon SQS) 通知を発行するアプリケーションの出力として AWS Lambda 関数を設定します。
- B. Amazon Kinesis Data Streams を使用して、料金所からすべてのデータを収集します。Kinesis Data Streams でストリームを作成して、Amazon S3 からのしきい値を一時的に保存します。両方のストリームを Amazon Kinesis Data Analytics に送信して、特定の料金所の車両数を対応するしきい値と比較します。しきい値に達しない場合は、AWS Lambda を使用して Amazon Simple Notification Service (Amazon SNS) 通知を発行します。Amazon Kinesis Data Firehose を Kinesis Data Streams に接続して、データを Amazon Redshift に配信します。
- C. Amazon Kinesis Data Firehose を使用してデータを収集し、Amazon Redshift に配信します。次に、Amazon Redshift のデータをクエリし、特定の料金所の車両数を Amazon S3 から読み取った対応するしきい値と比較し、Amazon Simple Notification Service (Amazon SNS) 通知を発行する AWS Lambda 関数を自動的にトリガーします。しきい値に達していません。
- D. Amazon Kinesis Data Firehose を使用してデータを収集し、Amazon Redshift と Amazon Kinesis Data Analytics に同時に配信します。Kinesis Data Analytics で参照データソースを作成して、Amazon S3 からのしきい値を一時的に保存し、特定の料金所の車両数を対応するしきい値と比較します。しきい値に達しない場合は、AWS Lambda を使用して Amazon Simple Notification Service (Amazon SNS) 通知を発行します。
正解:A
質問 # 92
企業は、ファイル名にタイムスタンプが含まれる JSON 形式でベンダーからデータを受け取ります。ベンダーはデータを Amazon S3 バケットにアップロードし、データは分析とレポートのために会社のデータ レイクに登録されます。同社は、5 日後にすべてのファイルを S3 Glacier にアーカイブするように S3 ライフサイクル ポリシーを構成しました。
同社は、AWS Glue クローラーが S3 標準ストレージからのみデータをカタログ化し、アーカイブされたファイルを無視するようにしたいと考えています。データ分析スペシャリストは、現在の S3 バケット構成を変更せずにこの目標を達成するためのソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれですか?
- A. AWS Glue の除外パターン機能を使用して、クローラーが除外する S3 Glacier ファイルを特定します。
- B. AWS Glue のインクルード パターン機能を使用して、クローラーが含める S3 標準ファイルを識別します。
- C. AWS Glue Data Catalog テーブルの excludeStorageClasses プロパティを使用して、S3 Glacier ストレージのファイルを除外します
- D. AWS Lambda を使用して元の S3 バケットから S3 Glacier ストレージ用の新しい S3 バケットにファイルを移動する自動化ジョブをスケジュールします。
正解:A
質問 # 93
企業は、履歴データを含むオンプレミスの PostgreSQL データベースをホストしています。内部のレガシー アプリケーションは、データベースを読み取り専用アクティビティに使用します。同社のビジネスチームは、できるだけ早くデータを Amazon S3 のデータレイクに移動し、分析のためにデータを充実させたいと考えています。
同社は、VPC とオンプレミス ネットワークの間に AWS Direct Connect 接続をセットアップしました。データ分析スペシャリストは、最小限の運用オーバーヘッドでビジネス チームの目標を達成するソリューションを設計する必要があります。
これらの要件を満たすソリューションはどれですか?
- A. Amazon RDS for PostgreSQL データベースを作成し、AWS Database Migration Service (AWS DMS) を使用してデータを Amazon RDS に移行します。AWS Data Pipeline を使用して、Amazon RDS for PostgreSQL テーブルからデータをコピーして強化し、データを Amazon S3 に移動します。Amazon Athena を使用してデータをクエリします。
- B. JDBC 接続を使用してオンプレミス データベースのデータをカタログ化するように AWS Glue クローラーを構成します。AWS Glue ジョブを使用してデータを強化し、結果を Apache Parquet 形式で Amazon S3 に保存します。Amazon Redshift クラスターを作成し、Amazon Redshift Spectrum を使用してデータをクエリします。
- C. JDBC 接続を使用してオンプレミス データベースのデータをカタログ化するように AWS Glue クローラーを構成します。AWS Glue ジョブを使用してデータを強化し、結果を Apache Parquet 形式で Amazon S3 に保存します。Amazon Athena を使用してデータをクエリします。
- D. カスタマイズされたバッチ アップロード プロセスを使用して、オンプレミスの PostgreSQL データベースから Amazon S3 にデータをアップロードします。AWS Glue クローラーを使用して、Amazon S3 のデータをカタログ化します。AWS Glue ジョブを使用して、結果を強化し、別の S3 バケットに Apache Parquet 形式で保存します。Amazon Athena を使用してデータをクエリします。
正解:A
質問 # 94
ある小売会社は、Amazon Redshift を使用してデータ ウェアハウス ソリューションを構築しています。その取り組みの一環として、同社は Amazon Redshift クラスターで作成されたファクト テーブルに数百のファイルをロードしています。同社は、ソリューションが最高のスループットを達成し、データを会社のファクト テーブルにロードするときにクラスター リソースを最適に使用することを望んでいます。
企業はこれらの要件をどのように満たす必要がありますか?
- A. S3DistCp を使用して複数のファイルを Hadoop 分散ファイル システム (HDFS) にロードし、HDFS コネクタを使用してデータを Amazon Redshift クラスターに取り込みます。
- B. 単一の COPY コマンドを使用して、データを Amazon Redshift クラスターにロードします。
- C. 複数の COPY コマンドを使用して、データを Amazon Redshift クラスターにロードします。
- D. Amazon Redshift クラスター ノードの数に等しい LOAD コマンドを使用し、データを各ノードに並列にロードします。
正解:B
解説:
https://docs.aws.amazon.com/redshift/latest/dg/c_best-practices-single-copy-command.html
質問 # 95
金融サービス会社は、毎日の株式取引データを取引所からデータ ストアに集約する必要があります。この会社では、データをデータ ストアに直接ストリーミングする必要がありますが、場合によっては SQL を使用してデータを変更することも許可しています。このソリューションは、最小限の待機時間で実行される複雑な分析クエリを統合する必要があります。ソリューションは、株価の異常の上位要因を表示できるビジネス インテリジェンス ダッシュボードを提供する必要があります。
会社の要件を満たすソリューションはどれですか?
- A. Amazon Kinesis Data Streams を使用して、データを Amazon Redshift にストリーミングします。Amazon Redshift を Amazon QuickSight のデータ ソースとして使用して、ビジネス インテリジェンス ダッシュボードを作成します。
- B. Amazon Kinesis Data Firehose を使用して、データを Amazon S3 にストリーミングします。Amazon Athena を Amazon QuickSight のデータ ソースとして使用して、ビジネス インテリジェンス ダッシュボードを作成します。
- C. Amazon Kinesis Data Firehose を使用して、データを Amazon Redshift にストリーミングします。Amazon Redshift を Amazon QuickSight のデータ ソースとして使用して、ビジネス インテリジェンス ダッシュボードを作成します。
- D. Amazon Kinesis Data Streams を使用して、データを Amazon S3 にストリーミングします。Amazon Athena を Amazon QuickSight のデータ ソースとして使用して、ビジネス インテリジェンス ダッシュボードを作成します。
正解:C
質問 # 96
運送会社は、トラックに取り付けられた IoT センサーを使用して、世界中の配送車両の車両データを収集します。同社は現在、センサー データを小さな .csv ファイルで Amazon S3 に送信しています。次に、ファイルはノードごとに 2 つのスライスを持つ 10 ノードの Amazon Redshift クラスターにロードされ、Amazon Athena と Amazon Redshift の両方を使用してクエリが実行されます。同社は、ファイルを最適化してクエリのコストを削減し、Amazon Redshift クラスターへのデータ読み込み速度を向上させたいと考えています。
これらの要件を満たすソリューションはどれですか?
- A. AWS Glue を使用して、ファイルを .csv から単一の大きな Apache ORC ファイルに変換します。ファイルを Amazon Redshift にコピーし、Amazon S3 から Athena でファイルをクエリします。
- B. AWS Glue を使用してファイルを .csv から Apache Parquet に変換し、20 個の Parquet ファイルを作成します。ファイルを Amazon Redshift にコピーし、Amazon S3 から Athena でファイルをクエリします。
- C. Amazon EMR を使用して、各 .csv ファイルを Apache Avro に変換します。ファイルを Amazon Redshift にコピーし、Amazon S3 から Athena でファイルをクエリします。
- D. AWS Glue を使用して、すべてのファイルを .csv から 1 つの大きな Apache Parquet ファイルに変換します。ファイルを Amazon Redshift にコピーし、Amazon S3 から Athena でファイルをクエリします。
正解:B
質問 # 97
あるマーケティング会社は、レポート機能とビジネス インテリジェンス機能を改善したいと考えています。計画段階で、同社は関連する利害関係者にインタビューし、次のことを発見しました。
運用チームのレポートは、当月のデータについて 1 時間ごとに実行されます。
営業チームは、複数の Amazon QuickSight ダッシュボードを使用して、いくつかのカテゴリに基づいて過去 30 日間のローリング ビューを表示したいと考えています。
また、営業チームは、レポート バックエンドに到達したらすぐにデータを表示したいと考えています。
財務チームのレポートは、先月のデータについては毎日実行され、過去 24 か月のデータについては月に 1 回実行されます。
現在、システムには 400 TB のデータがあり、毎月 100 TB が追加されると予想されます。同社は、可能な限り費用対効果の高いソリューションを探しています。
会社の要件を満たすソリューションはどれですか?
- A. 過去 24 か月のデータを Amazon S3 に保存し、Amazon Redshift Spectrum を使用してクエリを実行します。Amazon Redshift Spectrum をデータ ソースとして Amazon QuickSight を設定します。
- B. 過去 24 か月分のデータを Amazon Redshift に保存します。Amazon Redshift をデータ ソースとして Amazon QuickSight を設定します。
- C. 過去 2 か月のデータを Amazon Redshift に保存し、残りの月を Amazon S3 に保存します。必要に応じて、長時間実行される Amazon EMR と Apache Spark クラスターを使用してデータをクエリします。Amazon EMR をデータソースとして Amazon QuickSight を設定します。
- D. 過去 2 か月のデータを Amazon Redshift に保存し、残りの月を Amazon S3 に保存します。Amazon Redshift Spectrum の外部スキーマとテーブルをセットアップします。Amazon Redshift をデータ ソースとして Amazon QuickSight を設定します。
正解:D
質問 # 98
企業は、ログ データを含むオブジェクトを JSON 形式で保存する必要があります。オブジェクトは、AWS で実行されている 8 つのアプリケーションによって生成されます。6 つのアプリケーションは、1 秒あたり合計 500 KiB のデータを生成し、2 つのアプリケーションは、1 秒あたり最大 2 MiB のデータを生成できます。
データ エンジニアは、使用状況データをキャプチャして Amazon S3 バケットに保存するスケーラブルなソリューションを実装したいと考えています。使用状況データ オブジェクトは、再フォーマットし、.csv 形式に変換してから、Amazon S3 に保存する前に圧縮する必要があります。この会社は、ソリューションに含まれるカスタム コードをできるだけ少なくすることを要求しており、必要に応じてサービス クォータの引き上げを要求する権限をデータ エンジニアに与えています。
これらの要件を満たすソリューションはどれですか?
- A. 使用状況データ オブジェクトを Amazon DynamoDB テーブルに保存します。オブジェクトを S3 バケットにコピーするように DynamoDB ストリームを設定します。オブジェクトが S3 バケットに書き込まれたときにトリガーされるように AWS Lambda 関数を設定します。関数でオブジェクトを .csv 形式に変換します。
- B. アプリケーションごとに Amazon Kinesis データ ストリームを設定します。各アプリケーションのストリームから使用状況データ オブジェクトを読み取る AWS Lambda 関数を記述します。関数でデータの .csv 変換、再フォーマット、および圧縮を実行します。関数で出力を Amazon S3 に保存します。
- C. アプリケーションごとに 1 つのシャードで Amazon Kinesis データ ストリームを構成します。シャードから使用状況データ オブジェクトを読み取る AWS Lambda 関数を記述します。関数でデータの .csv 変換、再フォーマット、および圧縮を実行します。関数で出力を Amazon S3 に保存します。
- D. アプリケーションごとに Amazon Kinesis Data Firehose 配信ストリームを設定します。各アプリケーションのストリームからログ データ オブジェクトを読み取る AWS Lambda 関数を記述します。関数に再フォーマットと .csv 変換を実行させます。すべての配信ストリームで圧縮を有効にします。
正解:D
質問 # 99
あるマーケティング会社は、Salesforce、MySQL、および Amazon S3 にデータを持っています。この会社は、これら 3 つの場所からのデータを使用して、ユーザー向けのモバイル ダッシュボードを作成したいと考えています。同社は、ダッシュボードをどのように作成するべきか確信が持てず、カスタマイズとコーディングを最小限に抑えたソリューションを必要としています。
これらの要件を満たすソリューションはどれですか?
- A. Amazon Athena フェデレーテッド クエリを使用して、データ ソースを結合します。Amazon QuickSight を使用して、モバイル ダッシュボードを生成します。
- B. AWS Lake Formation を使用して、データ ソースを Amazon S3 に移行します。Amazon QuickSight を使用して、モバイル ダッシュボードを生成します。
- C. Amazon Redshift 連携クエリを使用してデータ ソースを結合します。Amazon QuickSight を使用して、モバイル ダッシュボードを生成します。
- D. Amazon QuickSight を使用してデータ ソースに接続し、モバイル ダッシュボードを生成します。
正解:C
質問 # 100
あるソフトウェア会社は、インストルメンテーション データを使用してエラーを検出および解決し、アプリケーションの回復時間を短縮したいと考えています。同社は、エラー率や応答時間のスパイクなどの API 使用率の異常をほぼリアルタイム (NRT) で検出する必要があります。同社はまた、データ アナリストが NRT のログ分析のためにダッシュボードにアクセスできることを要求しています。これらの要件を満たすソリューションはどれですか?
- A. Amazon Kinesis Data Firehose をデータ ロギング用のデータ トランスポート レイヤーとして使用する Amazon Kinesis Data Analytics を使用して、NRT API 使用率の異常を明らかにする Kinesis Data Firehose を使用して、ログ データを Amazon OpenSearch Service (Amazon Elasticsearch Service) に配信し、検索、ログ分析、およびアプリケーションの監視 ダッシュボードには、Amazon OpenSearch Service (Amazon Elasticsearch Service) の OpenSearch Dashboards (Kibana) を使用します。
- B. Amazon Kinesis Data Analytics を、データをログに記録するためのデータ トランスポート レイヤーとして使用します。Amazon Kinesis Data Streams を使用して、NRT モニタリングメトリクスを明らかにします。Amazon Kinesis Data Firehose を使用して、ログ データを Amazon OpenSearch Service (Amazon Elasticsearch Service) に配信し、検索、ログ分析、およびアプリケーションの監視を行います ダッシュボードに Amazon QuickSight を使用します
- C. Amazon Kinesis Data Firehose をデータ ロギング用のデータ トランスポート レイヤーとして使用する Amazon Kinesis Data Analytics を使用して NRT モニタリング メトリクスを明らかにする Amazon Kinesis Data Streams を使用してログ データを Amazon OpenSearch Service (Amazon Elasticsearch Service) に配信し、検索、ログ分析を行う、およびアプリケーションの監視 ダッシュボードには Amazon QuickSight を使用します。
- D. Amazon Kinesis Data Analytics をデータ トランスポート レイヤーとして使用してデータをログに記録し、NRT 監視メトリクスを明らかにする Amazon Kinesis Data Firehose を使用して、ログ データを Amazon OpenSearch Service (Amazon Elasticsearch Service) に配信し、検索、ログ分析、およびアプリケーション監視を行うダッシュボードには、Amazon OpenSearch Service (Amazon Elasticsearch Service) の OpenSearch Dashboards (Kibana) を使用します。
正解:D
質問 # 101
ある会社は、Amazon Redshift をデータ ウェアハウスとして使用しています。新しいテーブルには、機密データを含む列があります。テーブル内のデータは、最終的に、1 日に何度も実行されるいくつかの既存のクエリによって参照されます。
データ アナリストは、1,000 億行のデータを新しいテーブルに読み込む必要があります。これを行う前に、データ アナリストは、監査グループのメンバーのみが機密データを含む列を読み取ることができることを確認する必要があります。
データ アナリストは、メンテナンスのオーバーヘッドを最小限に抑えながら、これらの要件を満たすにはどうすればよいでしょうか?
- A. すべてのデータを新しいテーブルにロードし、監査グループにテーブルから読み取る権限を付与します。機密と見なされるものを除くすべての列を含む新しいテーブルのビューを作成し、適切なユーザーにテーブルへの読み取り専用権限を付与します。
- B. すべてのデータを新しいテーブルにロードし、すべてのユーザーに非機密列への読み取り専用アクセス許可を付与します。機密データ列への明示的な ALLOW アクセスを使用して、IAM ポリシーを監査グループにアタッチします。
- C. すべてのデータを新しいテーブルにロードし、監査グループにテーブルから読み取る権限を付与します。機密データを含む列を除くすべてのデータを 2 番目のテーブルに読み込みます。適切なユーザーに 2 番目のテーブルへの読み取り専用アクセス許可を付与します。
- D. すべてのデータを新しいテーブルにロードし、監査グループにテーブルから読み取る権限を付与します。GRANT SQL コマンドを使用して、列のサブセットへの読み取り専用アクセスを適切なユーザーに許可します。
正解:D
解説:
https://aws.amazon.com/blogs/big-data/achieve-finer-grained-data-security-with-column-level-access-control-in-amazon-redshift/
質問 # 102
銀行会社は現在、高密度ストレージ (DS) ノードを備えた Amazon Redshift クラスターを使用して機密データを保存しています。監査により、クラスターが暗号化されていないことがわかりました。コンプライアンス要件では、機密データを含むデータベースは、自動キー ローテーションを使用してハードウェア セキュリティ モジュール (HSM) を介して暗号化する必要があると規定されています。
コンプライアンスを達成するために必要なステップの組み合わせはどれですか? (2つ選んでください。)
- A. クライアントとサーバー証明書を使用して HSM との信頼できる接続をセットアップし、自動キー ローテーションを行います。
- B. AWS CLI を介してキー ローテーションで HSM を有効にします。
- C. 新しい HSM 暗号化 Amazon Redshift クラスターを作成し、データを新しいクラスターに移行します。
- D. HSM で Elliptic Curve Diffie-Hellman Ephemeral (ECDHE) 暗号化を有効にします。
- E. HSM 暗号化オプションと自動キー ローテーションを使用してクラスターを変更します。
正解:B、E
質問 # 103
銀行は規制された環境で運営されています。銀行が営業している国のコンプライアンス要件では、各州の顧客データには、同じ州にいる銀行の従業員のみがアクセスできる必要があると規定されています。ある州の銀行員は、別の州で自宅住所を提供した顧客のデータにアクセスできないようにする必要があります。
銀行のマーケティング チームは、データ アナリストを雇って、特定の州で開始される新しいキャンペーンの顧客データから洞察を収集しました。現在、各顧客アカウントをホーム状態にリンクするデータは、プライベート S3 バケット内の単一の Amazon S3 フォルダー内の表形式の .csv ファイルに保存されています。S3 フォルダーの合計サイズは、非圧縮で 2 GB です。国のコンプライアンス要件により、マーケティング チームはこのフォルダーにアクセスできません。
データ アナリストは、マーケティング チームがキャンペーン分析プロジェクトのために顧客データに 1 回限りアクセスできるようにし、すべてのコンプライアンス要件と管理を遵守する責任があります。
データ アナリストは、必要な要件を満たすために必要なセットアップ作業を最小限に抑えるために、どのソリューションを実装する必要がありますか?
- A. 表形式のデータをデータ ソースとして直接インポートして、Amazon S3 から Amazon QuickSight Enterprise エディションにロードします。Amazon QuickSight に組み込まれている行レベルのセキュリティ機能を使用して、コンプライアンス管理下でマーケティング担当者に適切なデータ アクセスを提供します。プロジェクトが完了したら、Amazon QuickSight データ ソースを削除します。
- B. Amazon S3 のデータを再配置して、各州に関する顧客データを同じバケット内の異なる S3 フォルダーに保存します。S3 バケット ポリシーを設定して、コンプライアンス管理下でマーケティング担当者に適切なデータ アクセスを提供します。プロジェクトの後にバケット ポリシーを削除します。
- C. s3DistCp を使用して、Amazon S3 から Amazon EMR クラスターに表形式のデータをロードします。カスタム Hadoop ベースの行レベル セキュリティ ソリューションを Hadoop Distributed File System (HDFS) に実装して、マーケティング担当者にコンプライアンス管理下での適切なデータ アクセスを提供します。プロジェクト後に EMR クラスターを終了します。
- D. COPY コマンドを使用して、Amazon S3 から Amazon Redshift に表形式のデータをロードします。Amazon Redshift に組み込まれている行レベルのセキュリティ機能を使用して、コンプライアンス管理下でマーケティング担当者に適切なデータ アクセスを提供します。プロジェクトの後に Amazon Redshift テーブルを削除します。
正解:D
質問 # 104
ある企業は、データ レイク ストレージとしての Amazon S3 とデータ ウェアハウジング用の Amazon Redshift を含む分析ソリューションを構築しています。この会社は、Amazon Redshift Spectrum を使用して、Amazon S3 に保存されているデータをクエリしたいと考えています。
会社が Amazon Redshift Spectrum を使用して S3 データファイルをクエリする場合、パフォーマンスを向上させるためにどのような手順を実行する必要がありますか? (3 つ選択) 個々のファイル サイズが 1 ~ 5 GB の gzip 圧縮を使用する
- A. 分割できないファイル形式を使用する
- B. データを KB サイズのファイルに分割します。
- C. カラムナ ストレージ ファイル形式を使用する
- D. すべてのファイルをほぼ同じサイズに保ちます。
- E. 最も一般的なクエリ述語に基づいてデータを分割します
正解:B、D、E
質問 # 105
ある会社は、Amazon S3 からのデータを検証して変換し、毎日 1 回バッチで Amazon RDS for MySQL にロードするために、いくつかの AWS Glue ジョブを開発しました。ETL ジョブは、DynamicFrame を使用して S3 データを読み取ります。現在、ETL 開発者は、AWS Glue ジョブが実行ごとにすべての S3 入力データを処理するため、実行ごとに増分データのみを処理するという課題に直面しています。
開発者が最小限のコーディング作業で問題を解決できるのは、どのアプローチですか?
- A. ETL ジョブでカスタム ロジックを作成して、処理された S3 オブジェクトを追跡します。
- B. AWS Glue ジョブでジョブ ブックマークを有効にします。
- C. ETL ジョブを実行するたびに、処理されたオブジェクトまたはデータを Amazon S3 から削除します。
- D. ETL ジョブに、DataFrame を使用して Amazon S3 からデータを読み取らせます。
正解:B
質問 # 106
企業は、過去 3 か月のユーザー アクティビティを分析して、ユーザーの離職率を調査したいと考えています。何百万人ものユーザーにより、毎日 1.5 TB の非圧縮データが生成されます。クエリのパフォーマンス目標を達成するには、ノードごとに 2.56 TB のソリッド ステート ドライブ (SSD) ストレージを備えた 30 ノードの Amazon Redshift クラスターが必要です。
同社は、1 年分の履歴データに対して追加の分析を実行して、どの機能が最も人気があるかを示す傾向を調べたいと考えています。この分析は、週に 1 回行われます。
最も費用対効果の高いソリューションは何ですか?
- A. 過去 90 日間のデータを Amazon Redshift に保持します。90 日以上経過したデータを Amazon S3 に移動し、日付でパーティション分割された Apache Parquet 形式で保存します。次に、Amazon Redshift Spectrum を使用して追加の分析を行います。
- B. Amazon Redshift クラスターのサイズを 120 ノードに増やして、1 年間のデータを保持するのに十分なストレージ容量を確保します。次に、Amazon Redshift を使用して追加の分析を行います。
- C. Amazon Redshift クラスターの個々のノードで 16 TB のストレージ容量を追加するために、クラスター ノード タイプを高密度ストレージ ノード タイプ (DS2) にサイズ変更します。次に、Amazon Redshift を使用して追加の分析を行います。
- D. 過去 90 日間のデータを Amazon Redshift に保持します。90 日以上経過したデータを Amazon S3 に移動し、日付でパーティション分割された Apache Parquet 形式で保存します。次に、永続的な Amazon EMR クラスターをプロビジョニングし、Apache Presto を使用して追加の分析を行います。
正解:A
質問 # 107
あるマーケティング会社は、キャンペーンの反応データを Amazon S3 に保存しています。各キャンペーンのデータは、一貫した一連のソースから生成されています。データは .csv ファイルとして Amazon S3 に保存されます。ビジネス アナリストは、Amazon Athena を使用して各キャンペーンのデータを分析します。同社は、Athena を使用した継続的なデータ分析のコストを最小限に抑える必要があります。
これらの要件を満たすために、データ分析スペシャリストはどのアクションを組み合わせて実行する必要がありますか? (2つ選んでください。)
- A. .csv ファイルを Apache Avro に変換します。
- B. .csv ファイルを Apache Parquet に変換します。
- C. ソースごとにデータを分割します。
- D. .csv ファイルを圧縮します。
- E. キャンペーンごとにデータを分割します。
正解:B、E
解説:
https://aws.amazon.com/blogs/big-data/top-10-performance-tuning-tips-for-amazon-athena/
質問 # 108
......
結果を保証するには最新2023年06月無料:https://www.jpntest.com/shiken/AWS-Certified-Data-Analytics-Specialty-JPN-mondaishu