PDE 專業級
Professional Data Engineer
主編的話: 為 Professional Data Engineer 考試量身整理的學習夥伴,每個領域從頭梳理,搭配實戰練習題與擬真計時模擬考。
50 題 120 分鐘 通過門檻 700/1000 5 個領域 官方考試指南
目錄
I. 設計資料處理系統 佔 22%
批次與串流管道設計 (Batch and Streaming Pipeline Design) Dataflow 架構與選擇 (Dataflow Architecture and Selection) Dataproc 與 Hadoop/Spark 現代化 (Dataproc and Hadoop/Spark Modernization) Cloud Storage 資料湖架構 (Cloud Storage Data Lake Architecture) Cloud Bigtable 架構與效能設計 (Cloud Bigtable Schema and Performance Design) 用於資料工程的 Cloud Spanner 架構 BigQuery 資料建模與效能 資料儲存安全與 IAM 資料主權與合規性 PII 識別與去識別化 資料平台的災難復原 資料處理成本優化 II. 攝取與處理資料 佔 25%
Pub/Sub 訊息傳遞與串流攝取 Datastream for Change Data Capture (CDC) 大規模數據傳輸 Apache Beam 程式設計模型 進階 Dataflow:Windowing 與 Watermarks Dataflow Prime 與管道優化 使用 Dataproc 和 Spark 處理數據 Dataform SQL 工作流開發 Cloud Dataprep 和數據清洗 BigQuery 進階 SQL 與 UDF 處理重複與損壞資料 III. 儲存資料 佔 20%
BigQuery 版本與容量管理 BigQuery 儲存優化:資料分割(Partitioning)與叢集(Clustering) BigLake:統一儲存與安全性 BigQuery Omni:多雲分析 Dataplex:資料治理與型錄 Dataplex: Data Mesh 實作 Cloud Bigtable 效能與管理 Cloud Spanner 查詢優化 Analytics Hub 資料共享 Cloud SQL 與 AlloyDB 用於分析 IV. 準備與使用資料進行分析 佔 15%
BigQuery BI Engine 與加速 Looker 與 Looker Studio 整合 BigQuery ML: 模型訓練 BigQuery ML: 推論與部署 Vertex AI Pipelines 與協調管理 Vertex AI Feature Store Vector Search and Embeddings for GenAI Data Prep for LLMs and RAG Exploring Data with BigQuery Studio Governing AI with Vertex AI Model Monitoring