DAS-C01 Korean 無料問題集「Amazon AWS Certified Data Analytics - Specialty (DAS-C01 Korean Version)」

온라인 소매 회사는 보고 시스템을 AWS로 마이그레이션하고 있습니다. 회사의 레거시 시스템은 복잡한 일련의 중첩된 Apache Hive 쿼리를 사용하여 온라인 트랜잭션에서 데이터 처리를 실행합니다. 트랜잭션 데이터는 하루에 여러 번 온라인 시스템에서 보고 시스템으로 내보내집니다. 파일의 스키마는 업데이트 간에 안정적입니다.
데이터 분석가는 데이터 처리를 AWS로 신속하게 마이그레이션하기를 원하므로 코드 변경을 최소화해야 합니다. 스토리지 비용을 낮게 유지하기 위해 데이터 분석가는 데이터를 Amazon S3에 저장하기로 결정합니다. 보고서의 데이터 및 관련 분석은 Amazon S3의 데이터를 기반으로 완전히 최신 상태여야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족합니까?

미디어 회사는 Amazon S3 데이터 레이크에 있는 데이터에 대해 기계 학습 및 분석을 수행하려고 합니다. 회사 내의 소비자가 보고서를 생성할 수 있도록 하는 두 가지 데이터 변환 요구 사항이 있습니다.
예약된 시간에 Amazon S3에 도착하는 다양한 파일 형식으로 300GB의 데이터를 매일 변환합니다.
S3 데이터 레이크에 상주하는 테라바이트 규모의 아카이브 데이터에 대한 일회성 변환.
데이터 변환에 대한 회사의 요구 사항을 비용 효율적으로 충족하는 솔루션 조합은 무엇입니까? (3개를 선택하세요.)

正解:C、D、F 解答を投票する
회사는 한 달에 한 번 gzip으로 압축된 100MB .csv 파일을 받습니다. 이 파일에는 50,000개의 부동산 목록 레코드가 포함되어 있으며 Amazon S3 Glacier에 저장됩니다. 회사는 특정 공급업체에 대한 데이터의 하위 집합을 쿼리할 데이터 분석가가 필요합니다.
가장 비용 효율적인 솔루션은 무엇입니까?

모바일 게임 회사는 게임 앱에서 데이터를 캡처하고 데이터를 즉시 분석에 사용할 수 있도록 하려고 합니다. 데이터 레코드 크기는 약 20KB입니다. 회사는 각 장치에서 최적의 처리량을 달성하는 데 관심이 있습니다. 또한 회사는 각 소비자를 위한 전용 처리량을 갖춘 데이터 스트림 처리 애플리케이션을 개발하고자 합니다.
어떤 솔루션이 이 목표를 달성할까요?

解説: (JPNTest メンバーにのみ表示されます)
회사의 데이터 분석가는 Amazon Athena에서 실행되는 쿼리가 비용 관리 목적으로 규정된 양 이상의 데이터를 스캔할 수 없도록 해야 합니다. 규정된 임계값을 초과하는 쿼리는 즉시 취소해야 합니다.
이를 달성하기 위해 데이터 분석가는 무엇을 해야 합니까?

解説: (JPNTest メンバーにのみ表示されます)
데이터 분석가는 Amazon Redshift 클러스터에 데이터를 로드하는 동안 다음 오류 메시지를 발견했습니다.
"액세스하려는 버킷은 지정된 엔드포인트를 사용하여 주소를 지정해야 합니다." 이 문제를 해결하려면 데이터 분석가가 무엇을 해야 합니까?

解説: (JPNTest メンバーにのみ表示されます)
회사는 기록 데이터가 포함된 온프레미스 PostgreSQL 데이터베이스를 호스팅합니다. 내부 레거시 애플리케이션은 읽기 전용 활동에 데이터베이스를 사용합니다. 회사의 비즈니스 팀은 가능한 한 빨리 데이터를 Amazon S3의 데이터 레이크로 이동하고 분석을 위해 데이터를 보강하려고 합니다.
회사는 VPC와 온프레미스 네트워크 간에 AWS Direct Connect 연결을 설정했습니다. 데이터 분석 전문가는 최소한의 운영 오버헤드로 비즈니스 팀의 목표를 달성하는 솔루션을 설계해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족합니까?

회사에서 Amazon S3에 저장된 Elastic Load Balancing 로그에 대한 분석을 실행하려고 합니다. 데이터 분석가는 원하는 연도, 월 또는 일의 모든 데이터를 쿼리할 수 있어야 합니다. 데이터 분석가는 또한 열의 하위 집합을 쿼리할 수 있어야 합니다. 이 회사는 최소한의 운영 오버헤드와 가장 비용 효율적인 솔루션이 필요합니다.
로그 데이터를 최적화하고 쿼리하기 위한 이러한 요구 사항을 충족하는 접근 방식은 무엇입니까?

解説: (JPNTest メンバーにのみ表示されます)
회사는 Amazon S3에 PII(개인 식별 정보)가 포함된 판매 및 마케팅 데이터를 저장합니다. 이 회사는 분석가가 자체 Amazon EMR 클러스터를 시작하고 a라는 데이터로 분석 보고서를 실행할 수 있도록 허용합니다. 규정 준수 요구 사항을 충족하려면 회사는 이 프로세스 전체에서 데이터에 공개적으로 액세스할 수 없도록 해야 합니다. 데이터 엔지니어는 Amazon S3를 보호했지만 분석가가 생성한 개별 EMR 클러스터가 공용 인터넷에 노출되지 않도록 해야 합니다.
최소한의 노력으로 이 규정 준수 요구 사항을 충족하기 위해 데이터 엔지니어가 수행해야 하는 솔루션은 무엇입니까?

解説: (JPNTest メンバーにのみ表示されます)
제조 회사는 Amazon S3를 사용하여 데이터를 저장합니다.
ㅏ. 이 회사는 AWS Lake Formation을 사용하여 이러한 데이터 자산에 대한 세분화된 수준의 보안을 제공하려고 합니다. 데이터는 Apache Parquet 형식입니다. 회사는 컨설턴트가 데이터 레이크를 구축할 마감일을 정했습니다.
컨설턴트는 이러한 요구 사항을 충족하는 가장 비용 효율적인 솔루션을 어떻게 만들어야 합니까?

解説: (JPNTest メンバーにのみ表示されます)
한 회사에서 차량을 모니터링하는 서비스를 구축하고 있습니다. 이 회사는 각 차량의 장치에서 IoT 데이터를 수집하고 거의 실시간으로 Amazon Redshift에 데이터를 로드합니다. 차량 소유자는 차량 참조 데이터가 포함된 .csv 파일을 하루 중 서로 다른 시간에 Amazon S3에 업로드합니다. 야간 프로세스는 Amazon S3에서 Amazon Redshift로 차량 참조 데이터를 로드합니다. 이 회사는 장치의 IoT 데이터와 차량 참조 데이터를 결합하여 보고 및 대시보드를 강화합니다. 플릿 소유자는 대시보드가 ​​업데이트될 때까지 하루를 기다리느라 좌절하고 있습니다.
참조 데이터를 Amazon S3에 업로드하는 것과 소유자의 대시보드에 변경 사항이 표시되는 것 사이에 가장 짧은 지연 시간을 제공하는 솔루션은 무엇입니까?

소매 회사는 Amazon Redshift를 사용하여 데이터 웨어하우스 솔루션을 구축하고 있습니다. 이러한 노력의 일환으로 회사는 Amazon Redshift 클러스터에서 생성된 팩트 테이블에 수백 개의 파일을 로드하고 있습니다. 회사는 솔루션이 회사의 팩트 테이블에 데이터를 로드할 때 최고의 처리량을 달성하고 클러스터 리소스를 최적으로 사용하기를 원합니다.
회사는 이러한 요구 사항을 어떻게 충족해야 합니까?

解説: (JPNTest メンバーにのみ表示されます)
한 회사가 주차장에서 데이터를 수집합니다. 분석가들은 각 차고의 차량 수에 대한 보고서를 거의 실시간으로 실행할 수 있는 기능을 요청했습니다.
회사는 Amazon Redshift 클러스터에 데이터를 로드하는 수집 파이프라인을 구축하려고 합니다. 솔루션은 특정 차고의 차량 수가 특정 임계값을 초과하는 경우 운영 담당자에게 경고해야 합니다. 경고 쿼리는 차고 임계값을 정적 참조로 사용합니다. 임계값은 Amazon S3에 저장됩니다.
이러한 요구 사항을 충족하는 가장 운영 효율적인 솔루션은 무엇입니까?

解説: (JPNTest メンバーにのみ表示されます)
회사는 Amazon S3에 Apache Parquet 형식의 파일을 저장합니다. 회사는 AWS Glue 데이터 카탈로그를 사용하여 테이블 메타데이터를 저장하고 Amazon Athena를 사용하여 데이터를 쿼리하고 분석합니다. 테이블의 데이터 데이터 분석가는 새 데이터가 도착하면 테이블에 새로운 시간 파티션을 추가합니다. 데이터 분석가는 쿼리 실행 시간을 줄여 달라는 요청을 받았습니다. 어떤 솔루션이 쿼리 실행 시간을 가장 많이 단축할까요?

제조 회사는 1년 동안 공장 현장의 장치에서 IoT 센서 데이터를 수집하고 매일 분석을 위해 Amazon Redshift에 데이터를 저장하고 있습니다. 데이터 분석가는 하루에 약 2TB의 예상 수집 속도에서 클러스터가 4개월 이내에 축소될 것이라고 판단했습니다. 장기적인 해결책이 필요합니다. 데이터 분석가는 대부분의 쿼리가 가장 최근 13개월의 데이터만 참조한다고 지적했지만 지난 7년 동안 생성된 모든 데이터를 쿼리해야 하는 분기별 보고서도 있습니다. CTO(Chief Technology Officer)는 장기적인 솔루션의 비용, 관리 노력 및 성능에 관심을 가집니다.
데이터 분석가는 이러한 요구 사항을 충족하기 위해 어떤 솔루션을 사용해야 합니까?

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡