Databricks-Certified-Professional-Data-Engineer Korean 無料問題集「Databricks Certified Professional Data Engineer Exam (Databricks-Certified-Professional-Data-Engineer Korean Version)」

데이터 엔지니어는 데이터 레이크에서 대량의 원시 JSON 로그를 가져와 보고용 Delta 테이블로 변환하는 야간 배치 ETL 파이프라인을 구축하는 업무를 맡았습니다. 데이터는 하루에 한 번 대량으로 유입되며, 파이프라인 처리에는 몇 시간이 소요됩니다. 비용 효율성도 중요하지만, 파이프라인 완료의 성능과 신뢰성이 최우선 과제입니다.
데이터 엔지니어는 어떤 유형의 Databricks 클러스터를 구성해야 할까요?

解説: (JPNTest メンバーにのみ表示されます)
작업 실행 기록 보존과 관련하여 다음 중 어떤 설명이 맞습니까?

데이터 엔지니어링 팀이 Databricks Unity Catalog에서 액세스 제어를 구성하고 있습니다. 그들은 analyst_group에 sales catalog에 대한 SELECT 권한을 부여했으며, 이 그룹의 구성원은 카탈로그 내의 모든 현재 및 향후 스키마, 테이블 및 뷰에 대한 SELECT 액세스 권한을 자동으로 갖게 될 것으로 예상합니다.
Unity Catalog에서 권한 상속 동작을 어떻게 설명하나요?

解説: (JPNTest メンバーにのみ表示されます)
주니어 데이터 엔지니어가 Delta Lake의 변경 데이터 피드(Change Data Feed) 기능을 활용하여 `delta.enableChangeDataFeed = true` 속성으로 생성된 브론즈 테이블의 모든 행에 대해 유효했던 모든 값을 나타내는 유형 1 테이블을 생성하려고 합니다. 이 엔지니어는 다음 코드를 매일 실행할 계획입니다.

다음 중 위 쿼리를 여러 번 실행했을 때의 실행 과정과 결과를 가장 잘 설명하는 문장은 무엇입니까?

解説: (JPNTest メンバーにのみ表示されます)
데이터 엔지니어가 스트리밍 주문 데이터를 처리하기 위해 Lakeflow 선언적 파이프라인을 설계하고 있습니다. 이 파이프라인은 Auto Loader를 사용하여 데이터를 수집하며, customer_id와 amount 값이 0보다 큰지 확인하여 데이터 품질을 보장해야 합니다. 유효하지 않은 레코드는 삭제해야 합니다.
Lakeflow Declarative Pipelines 구성 중 어떤 구성이 Python을 사용하여 이 요구 사항을 구현합니까?

解説: (JPNTest メンバーにのみ表示されます)
데이터 엔지니어링 팀은 고객 데이터 삭제(잊혀질 만한 데이터) 요청을 처리하는 작업을 구성했습니다. 삭제해야 할 모든 사용자 데이터는 기본 테이블 설정을 사용하여 Delta Lake 테이블에 저장됩니다.
팀은 지난주 삭제된 모든 데이터를 매주 일요일 새벽 1시에 일괄 처리하기로 결정했습니다. 이 작업의 총 소요 시간은 1시간 미만입니다. 또한 매주 월요일 새벽 3시에는 일괄 작업이 조직 전체의 Delta Lake 테이블에 대해 일련의 VACUUM 명령을 실행합니다.
준법감시 담당자는 최근 Delta Lake의 타임 트래블 기능에 대해 알게 되었습니다. 이 기능으로 인해 삭제된 데이터에 계속 접근할 수 있을 가능성을 우려하고 있습니다.
모든 삭제 로직이 올바르게 구현되었다고 가정할 때, 다음 중 이 문제를 정확하게 해결하는 문장은 무엇입니까?

解説: (JPNTest メンバーにのみ表示されます)
Spark UI에서 술어 푸시다운을 활용하지 않아 발생하는 성능 문제를 진단할 수 있는 곳은 어디인가요?

解説: (JPNTest メンバーにのみ表示されます)
Databricks Auto Loader의 기본 실행 모드를 설명하는 문장은 무엇입니까?

解説: (JPNTest メンバーにのみ表示されます)

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡