Amazon Managed Service for Apache Flink — 串流處理 - DEA-C01 資料工程師學習筆記

Q: Q2 — 我該如何在 Flink 中處理遲到資料？

有三種選擇。 捨棄 (預設) ：超過浮水印的事件會被靜默丟棄。成本最低，但會丟失資料 — 僅適用於非關鍵性的彙總。 側輸出 (Side output) ：將遲到事件路由到單獨的流中，以便進行離線重新處理或稽核。當必須考慮遲到事件但不需要它們更新主結果時很有用。 允許遲到 (Allowed lateness) ：延長視窗關閉的持續時間，接受並為在遲到視窗內到達的事件重新發送更新後的結果。表達能力最強，但下游取用者必須能處理更新語義。DEA-C01 考試會詢問「來自慢速來源的事件在彙總中缺失」的情境 — 修復方案是這三種處理策略之一，取決於您是能容忍捨棄、需要稽核還是需要更新結果。

Q: Q5 — 我該如何擴展 Managed Flink 應用程式？

有兩個擴展軸。 平行度 (Parallelism) ：每個運算子的平行執行個體數量。針對吞吐量受限的工作負載增加平行度。在應用程式程式碼或通過 Managed Flink 配置顯式設定平行度。 KPU ：總運算容量（平行度 * 每個任務槽的 KPU 比例）。針對記憶體受限或狀態受限的工作負載增加 KPU。自動擴展會根據觀察到的利用率在配置的上下限內調整 KPU。從 CloudWatch 指標診斷擴展需求：高 CPU 利用率意味著需要更多平行度，檢查點持續時間長意味著需要更多記憶體，高背壓 (backpressure) 則意味著下游運算子是瓶頸。DEA-C01 考試會詢問「Flink 工作落後於輸入速率」的情境 — 答案取決於哪個指標是瓶頸信號。

Amazon Managed Service for Apache Flink（前稱 Kinesis Data Analytics for Apache Flink）是 AWS 用於具狀態串流處理的託管運行環境。在 DEA-C01 考試中，它是串流情境下任務 1.2（轉換與處理資料）中含金量最高的服務。來自 Tutorials Dojo、ExamCert.App 以及流行的 Medium 部落格等社群學習指南都指出了相同的痛點：具有批次處理背景的考生容易低估串流處理的深度，特別是視窗語義、處理遲到資料的浮水印機制，以及實現容錯具狀態處理所需的檢查點 (checkpointing) 要求。考試常會設定陷阱，其中錯誤答案可能是「Lambda」，因為 Lambda 無法跨調用維護狀態；或者是「Kinesis Data Firehose」，因為 Firehose 無法執行視窗化彙總。要掌握 Managed Flink，意味著必須透徹理解編程模型、視窗類型、狀態管理以及典型陷阱。

本學習筆記從資料工程師的角度出發，涵蓋了 Managed Flink 的定義及其存在意義、三種編程模型（DataStream API、Table API、Flink SQL）、四種視窗類型（翻轉、滑動、工作階段、全域）、使用 Keyed state 和 Operator state 的具狀態處理、用於容錯的檢查點 (checkpoints) 與儲存點 (savepoints)、來源與接收器（KDS、MSK、S3、Redshift、OpenSearch）、平行度與 KPU 擴展、遲到資料與浮水印、用於互動式開發的 Studio 筆記本、成本模型、常見整合模式以及容易失分的考試陷阱。讀完本筆記後，您將能在任何架構審查或 DEA-C01 場景中，針對串流處理決策給出專業的解釋與辯護。

什麼是 Amazon Managed Service for Apache Flink？

Apache Flink 是一個開源的分散式處理引擎，專為無界資料流上的具狀態計算而設計。Managed Service for Apache Flink 讓您無需佈建或管理底層運算叢集即可運行 Flink 應用程式。AWS 負責處理 JobManager 和 TaskManager 的佈建、檢查點存儲、自動擴展和版本升級；您只需編寫 Flink 應用程式程式碼（Java、Scala、使用 PyFlink 的 Python 或 SQL）並提交即可。

為什麼需要託管串流處理引擎

如果串流流水線只是將事件寫入 S3 (Firehose) 或為每條記錄調用一次 Lambda (Lambda+Kinesis)，那麼它是無狀態的 — 每條記錄都是獨立處理的。然而，現實中的分析需求很快就會要求「狀態」：例如「每台感測器每 5 分鐘的滾動平均溫度」、「基於工作階段的使用者行為彙總」、「根據每位客戶最後 100 筆交易計算的欺詐評分」。無狀態處理無法回答這些問題，因為答案取決於之前的記錄。

Flink 的價值在於內建的分散式狀態管理、事件時間處理以及「正好一次 (exactly-once)」語義。運行環境在容錯的後端維護 Keyed state（按分割區鍵）和 Operator state（按任務），在發生故障時從檢查點恢復狀態，並通過浮水印處理遲到資料。在 Lambda 或 Kinesis Client Library 中從零開始構建這些功能需要數月的工程量，而 Managed Flink 則將其作為一項服務提供。

從 Kinesis Data Analytics 到 Managed Flink

最初推出時名為 Kinesis Data Analytics (KDA)，包含 SQL、Apache Flink 和 Apache Beam 三種風味。AWS 已於 2024 年棄用了 KDA 上的 SQL 風味，並將 Apache Flink 風味更名為 Amazon Managed Service for Apache Flink。較舊的學習指南可能仍參考「Kinesis Data Analytics」— 在 DEA-C01 考試中，請將其視為具有新名稱和功能集的 Managed Flink。

Amazon Managed Service for Apache Flink 是 AWS 提供的 Apache Flink 託管運行環境 — 是一個分散式引擎，用於在具有事件時間語義和正好一次保證的無界流上進行具狀態計算。這是它的核心定義。在 DEA-C01 考試中，任何提到「具狀態」、「視窗化彙總」、「滾動計算」、「基於工作階段」或「正好一次串流處理」的情境都指向 Managed Flink。無狀態的逐筆事件處理（過濾、轉換、路由）可以使用 Lambda 或 Firehose Lambda 轉換來完成；一旦需要跨事件的狀態，Managed Flink 就是正確答案。

Apache Flink 編程模型

Flink 提供三種不同的編程抽象層級。請根據團隊技能、複雜度和案例進行選擇。

DataStream API — 最底層、最強大

DataStream API 是 Flink 基於 Java/Scala（或 Python 的 PyFlink）的基礎串流處理 API。您可以用程式化方式定義來源、轉換（map、filter、keyBy、window、aggregate）和接收器。適用於複雜的具狀態邏輯、自定義視窗以及與自定義資料源的整合。權衡點在於需要編寫最多的程式碼，且技術門檻最高。

Table API — 宣告式、強類型

Table API 是 DataStream API 之上的關係型抽象。您定義資料表（資料流上的邏輯視圖），套用 select/filter/groupBy/window 等操作，Flink 在底層將其轉換為優化的 DataStream 程式碼。其程式碼量少於 DataStream API，對於大多數分析模式具有相同的表達能力。非常適合熟悉關係型思維的團隊。

Flink SQL — 串流上的純 SQL

Flink SQL 是擴展了串流基元的 ANSI SQL（包括時間上的視窗函數、用於模式檢測的 MATCH_RECOGNIZE）。您針對邏輯流編寫 SQL 查詢，Flink 將其轉換為執行期程式碼。對於精通 SQL 的團隊來說門檻最低。適用於視窗化彙總、聯接、簡單模式檢測和分析型轉換。Studio 筆記本（基於 Zeppelin）使 Flink SQL 具備互動性。

選擇編程模型

Flink SQL：簡單彙總、視窗化、聯接、分析型轉換。Table API：類似案例，但具有強類型和對 IDE 友好的 Java/Scala 支持。DataStream API：複雜具狀態邏輯、自定義視窗、與外部系統整合、流水線內的機器學習推理。DEA-C01 考試會問類似「團隊精通 SQL 且需要視窗化彙總」（Flink SQL）或「具有自定義狀態的複雜 CEP 模式檢測」（DataStream API）的情境題。

視窗 (Windowing) — 串流處理的核心

串流處理需要將無界流界定為有限的組以進行彙總。Flink 支持四種視窗類型。

翻轉視窗 (Tumbling Windows) — 固定、不重疊

翻轉視窗將時間劃分為固定大小、不重疊的塊。一個 5 分鐘的翻轉視窗每 5 分鐘塊發送一次結果：00:00-00:05, 00:05-00:10, 00:10-00:15。每個事件僅屬於一個視窗。適用於定期彙總：如「每分鐘交易量」、「每日營收」、「每小時活躍使用者」。

滑動視窗 (Sliding Windows) — 固定大小、有重疊

滑動視窗具有固定大小和滑動間隔；連續的視窗會發生重疊。一個每 1 分鐘滑動一次的 5 分鐘視窗，每分鐘會發送一次涵蓋過去 5 分鐘資料的結果：00:00-00:05, 00:01-00:06, 00:02-00:07。每個事件屬於多個視窗。適用於滾動彙總：如「滾動 5 分鐘平均響應時間」、「移動 10 分鐘欺詐率」。

工作階段視窗 (Session Windows) — 基於活動

工作階段視窗根據活動間隙對事件進行分組。當在配置的逾時時間內（例如 30 分鐘）沒有事件到達時，工作階段結束。不同的索引鍵可以有不同的工作階段邊界。適用於使用者工作階段分析：如「每個使用者工作階段的事件數」、「平均工作階段持續時間」、「流失前的操作」。

全域視窗 (Global Windows) — 手動觸發

全域視窗將具有相同索引鍵的所有事件分配給單個視窗，且不會自動發送結果。您需要附加一個自定義觸發器 (trigger) 來決定何時發送結果。適用於內建視窗無法滿足的進階模式。

翻轉視窗不重疊且每個固定間隔發送一次結果；滑動視窗會重疊並按滑動間隔發送結果；工作階段視窗基於活動並在非活動間隙結束。 請為 DEA-C01 考試記住這三者。任何描述「每 5 分鐘報告一次計數」的情境都是翻轉視窗。任何描述「每分鐘更新一次的滾動 5 分鐘平均值」的情境都是滑動視窗。任何描述「按非活動間隙分組的使用者活動」的情境都是工作階段視窗。選錯視窗類型是生產環境和考試中最常見的串流處理錯誤之一。

事件時間 (Event-Time) vs 處理時間 (Processing-Time)

Flink 支持兩種時間概念，這種區分對於考試至關重要。

處理時間 — 運算子處的時鐘時間

處理時間使用 Flink 運算子處的掛鐘時間。實現較簡單，結果取決於運算子執行的時間點而非事件語義。處理時間下的 5 分鐘翻轉視窗涵蓋了在該掛鐘時間窗口內到達運算子的事件，而不論事件實際發生的時間。

事件時間 — 嵌入在事件中的時間戳記

事件時間使用嵌入在每個事件中的時間戳記（由 TimestampAssigner 提取）。事件時間下的 5 分鐘翻轉視窗涵蓋了嵌入時間戳落在該範圍內的事件，而不論它們何時到達運算子。事件時間在不同執行次數之間產生確定的結果，且在排序重要或必須正確處理遲到事件時是必需的。

為什麼事件時間對大多數現實案例勝出

使用者點擊流流水線必須分組「14:00-15:00 使用者工作階段期間發生的事件」 — 而不是「運算子在 14:00-15:00 接收到的事件」。網路延遲、重試風暴或生產端停機可能會使事件延遲數分鐘；處理時間會將它們歸入錯誤的視窗。帶有浮水印的事件時間可以正確地將它們歸因於原始工作階段。

浮水印 (Watermarks) — 處理遲到資料

浮水印是 Flink 用於宣告「時間戳 ≤ X 的所有事件可能都已到達」的機制。

什麼是浮水印

浮水印是注入流中的一種特殊事件，信號告知「（極大機率）不會再有晚於此時間戳的事件到達」。Flink 運行環境使用浮水印來決定何時關閉事件時間視窗並發送結果。

有界失序 (Bounded Out-of-Orderness) 策略

最常見的浮水印策略是有界失序：假設事件最多延遲 N 秒到達，則生成時間戳為（當前事件時間戳 - N 秒）的浮水印。對於延遲不超過 30 秒的點擊流，浮水印 = 當前事件時間戳 - 30 秒。當浮水印超過視窗結束時間時，視窗關閉。

遲到事件 (Late-Arriving Events)

在浮水印超過其事件時間視窗後到達的事件稱為「遲到資料」。Flink 提供三種處理策略：捨棄 (drop)（預設，事件被靜默丟棄）、側輸出 (side output)（將遲到事件路由到單獨的流中以便稍後分析）、允許遲到 (allowed lateness)（在最終關閉前，將視窗關閉時間延長 N 秒）。根據案例選擇：非關鍵的高流量資料選捨棄，稽核需求選側輸出，當您可以等待更新時選允許遲到。

浮水印生成頻率

浮水印的生成頻率應足以保持較低的流水線延遲（通常每 200 毫秒一次），但不能過於頻繁以至於開銷過大。配置錯誤的浮水印是最常見的 Flink 錯誤：太激進（在遲到事件到達前關閉視窗，導致資料丟失）或太懶惰（視窗永不關閉，結果永不發送，記憶體無限增長）。

預設情況下，遲到事件會被靜默捨棄 — 您必須配置側輸出或允許遲到來處理它們。 這是常見的生產問題和考試陷阱：由於事件在浮水印關閉視窗 30 秒後才到達，Flink 流水線在下游儀表板中產生了「資料缺失」警報。Flink 的預設行為是捨棄。修復方案取決於需求：用於稽核和重新處理的側輸出、用於「再等一會兒」的允許遲到，或者如果遲到事件是可預測的，則使用具有更大有界失序範圍的視窗。DEA-C01 考試會設定「來自慢速來源的事件在下游彙總中缺失」的情境 — 答案是調整浮水印配置加上遲到事件處理，而不是增加分片 (shards) 或 KPU。

具狀態串流處理 (Stateful Stream Processing)

Flink 的顯著特性是內建的分散式狀態。

Keyed State — 每個分割區鍵的狀態

當您對流執行 keyBy 時，Flink 會按鍵劃分記錄，並讓每個運算子執行個體存取以該分割區為鍵的狀態後端。常見狀態類型：ValueState（每個鍵一個值，例如最後看到的戳記）、ListState（每個鍵一個值列表，例如最近交易）、MapState（每個鍵一個映射，例如特徵字典）、ReducingState/AggregatingState（增量彙總值）。

Operator State — 每個任務執行個體的狀態

Operator state 的範圍限定在任務執行個體，而不是分割區鍵。常見用途：來源連接器追蹤已讀取的 Kinesis 分片偏移量。在應用程式程式碼中的使用頻率低於 Keyed state。

狀態後端 (State Backends)

Flink 將狀態存儲在狀態後端中。Managed Flink 預設使用 RocksDB（磁碟加上熱資料的記憶體），它可以擴展到數 TB 的狀態。對於具有更嚴格延遲要求的小狀態工作負載，可以使用僅限記憶體的後端。

檢查點 (Checkpoints) — 容錯狀態

Flink 定期將所有狀態的快照擷取到持久存儲中（在 Managed Flink 中為 S3）。發生故障時，Flink 會重啟應用程式並從上一個完成的檢查點恢復狀態。只要來源支持重播（如 KDS、MSK）且接收器支持事務提交或等冪寫入（如 S3、Iceberg、帶有事務的 Kafka），Flink 運行環境就能保證跨檢查點邊界的「正好一次」語義。

儲存點 (Savepoints) — 手動狀態快照

儲存點類似於檢查點，但它是手動觸發的（通常在程式碼部署前）。操作員通過帶著儲存點停止、部署新程式碼並從儲存點重啟來升級 Flink 工作 — 從而在升級過程中保留狀態。

務必在生產環境的 Managed Flink 應用程式中啟用檢查點功能 — 檢查點是使具狀態處理具備容錯能力且滿足正好一次語義的關鍵。 如果沒有檢查點，TaskManager 故障或應用程式重啟將導致所有記憶體中的狀態丟失，流水線要麼從來源開頭重新讀取（如果保留期已過，這可能代價高昂或無法實現），要麼完全跳過丟失的工作。Managed Flink 預設每 1 分鐘執行一次檢查點，狀態存儲在託管的 S3 位置。請根據狀態大小和復原時間目標 (RTO) 調整間隔：較短的間隔意味著恢復更快，但檢查點開銷較高。停用檢查點會使 Flink 變成一個不具備容錯能力的盡力而為處理器 — 這絕不是生產環境的正確選擇。

來源 (Sources) 與接收器 (Sinks)

Managed Flink 應用程式從來源讀取並寫入接收器。其連接器生態系統非常廣泛。

常見來源

Amazon Kinesis Data Streams（內建連接器，基於 KCL 並支持 EFO）。Amazon MSK（Kafka 來源連接器）。自管 Kafka（Kafka 來源連接器）。Amazon S3（用於批次重新處理或混合流水線的檔案來源）。Amazon Kinesis Data Firehose 不是來源 — Firehose 僅負責遞送，不負責讀取。

常見接收器

Amazon S3（寫入按事件時間分割的 Parquet、ORC、JSON、CSV）。Amazon Kinesis Data Streams（轉發到另一個流）。Amazon Kinesis Data Firehose（遞送到 S3/Redshift/OpenSearch）。Amazon Redshift（通過 Firehose 或通過自定義 JDBC 接收器）。Amazon OpenSearch（直接連接器或通過 Firehose）。Amazon DynamoDB（DynamoDB 接收器連接器）。Apache Iceberg（以具有 ACID 語義的方式寫入 S3 上的 Iceberg 表）。

連接器配置

每個連接器都需要在應用程式程式碼中進行配置：流/主題名稱、還原序列化結構描述、浮水印策略（針對來源）、序列化結構描述、批次處理參數（針對接收器）。常見模式記錄在 AWS Managed Flink GitHub 範例中。

平行度與 KPU 擴展

Managed Flink 通過平行度進行擴展，按 KPU 計費。

什麼是 KPU

Kinesis Processing Unit (KPU) 是 Managed Flink 的計費單位。1 KPU = 1 vCPU + 4 GB 記憶體 + 固定數量的狀態存儲。價格按每 KPU 小時計算（us-east-1 基準價格為 $0.11/小時）。應用程式根據平行度和記憶體需求使用可配置數量的 KPU。

平行度 (Parallelism) 與任務槽 (Task Slots)

Flink 應用程式被劃分為平行任務。平行度是每個運算子的平行執行個體數量。每個 KPU 提供承載平行任務的任務槽。較高的平行度每秒處理更多事件，但消耗更多 KPU。

自動擴展 (Auto-Scaling)

Managed Flink 支持自動擴展：AWS 根據觀察到的 CPU 和記憶體利用率調整平行度（從而調整 KPU）。設定 KPU 的上下限，服務將在其中進行擴展。自動擴展針對持續負載做出反應 — 短時間的激增可能不會觸發擴展。

規模調整指南

吞吐量受限的工作負載：平行度大致等於輸入分割區/分片數量。狀態受限的工作負載：需要更多 KPU 以將狀態放入記憶體。網路受限的工作負載（大量跨任務洗牌）：需要更多 KPU 以處理任務間的資料移動。DEA-C01 考試會問情境題，如「Flink 應用程式 CPU 利用率高」（增加平行度/KPU）或「檢查點持續時間長」（增加記憶體/縮短檢查點間隔）。

Managed Flink vs EMR 上的自管 Flink

Managed Flink 是在 AWS 上運行 Flink 的兩種方式之一。

Managed Flink 的優勢

零叢集管理。託管的檢查點存儲。自動擴展。通過 Java JAR 或 Python 檔案上傳即可簡單部署。按 KPU 小時付費，除了最小值外沒有閒置叢集成本。

EMR Flink 的優勢

可自定義 Flink 版本。可進行超出 Managed Flink 預設值的自定義網路和 IAM 設定。與 Hive、Presto、Hudi 共存，適用於混合批次-串流流水線。在極高且持續的吞吐量下，由於 EC2 預留執行個體價格，成本更低。

何時選擇哪一個

Managed Flink：大多數團隊、大多數工作負載，特別是當操作簡便性至關重要時。EMR Flink：當需要自定義配置或與其他大數據框架共存時。DEA-C01 考試偶爾會涉及此決策 — 預設答案是 Managed Flink，除非需求明確要求 EMR 的自定義或共存特性。

Studio 筆記本 — 互動式 Flink SQL

Managed Flink Studio 是一個基於 Zeppelin 的筆記本環境，用於互動式 Flink SQL 開發。

Studio 提供什麼

在 Zeppelin 筆記本中執行互動式 Flink SQL。即時預覽串流結果。將經過驗證的 SQL 查詢提升為生產環境的 Managed Flink 應用程式。內建與 Kinesis、MSK 和 Glue Data Catalog 表的連接器。

Studio vs 生產應用程式

Studio 用於開發和探索。生產應用程式作為獨立的 Managed Flink 應用程式（Java JAR 或 PyFlink 檔案）運行。Studio 的「部署為應用程式」功能可將測試過的 SQL 查詢轉換為生產應用程式。

常見整合模式

真實的 Flink 架構在標準模式中結合了來源、處理和接收器。

模式 1 — KDS 到 Flink 到 Firehose 到 S3

Kinesis Data Streams 擷取事件。Flink 從 KDS 讀取，執行視窗化彙總或增強，將結果寫入下游 Kinesis Data Stream。從下游流分出的 Kinesis Data Firehose 將資料遞送到 S3，並按事件時間分割為 Parquet 格式。輸出的 S3 路徑可從 Athena 查詢。

模式 2 — MSK 到 Flink 到 OpenSearch

MSK Kafka 主題承載事件。Flink 讀取，執行工作階段視窗化或模式檢測，通過 OpenSearch 接收器連接器將結果寫入 OpenSearch。OpenSearch Dashboards 中的即時儀表板顯示即時彙總結果。

模式 3 — KDS 到 Flink 到 Iceberg

Kinesis Data Streams 擷取來自資料庫的 CDC 事件。Flink 讀取，執行 upsert 邏輯，寫入 S3 上的 Apache Iceberg 表。下游的 Athena 和 EMR 以 ACID 語義查詢 Iceberg 表。

模式 4 — 雙流聯接 (Two-Stream Join)

兩個 Kinesis Data Streams（訂單和庫存更新）根據 product_id 以事件時間語義進行聯接。Flink 維護兩個流的 Keyed state，在視窗間隔（最後 10 分鐘）內聯接它們，並發送增強後的訂單事件。

成本模型

Managed Flink 計費按 KPU 小時計算，外加檢查點存儲費用。

KPU 定價

應用程式處理每 KPU 小時 $0.11（us-east-1 基準）。1 KPU = 1 vCPU + 4 GB 記憶體。

應用程式存儲

每個 KPU 包含 50 GB 持久性應用程式存儲；額外存儲（運行的應用程式和持久應用程式備份）按每 GB 月收費。

頻寬

同一區域內 Managed Flink 與其他 AWS 服務之間的資料傳輸是免費的；跨區域或網際網路輸出將產生標準資料傳輸費用。

與替代方案的成本比較

對於低吞吐量的具狀態處理，Lambda 可能看起來更便宜，但無法維護狀態 — 添加用於外部狀態的 DynamoDB 或 ElastiCache 後的總成本通常超過 Managed Flink。對於高吞吐量的持續工作負載，預留執行個體上的 EMR Flink 可能更便宜，但運行 EMR 叢集的操作成本不可忽視。對於大多數具狀態串流工作負載，Managed Flink 在操作簡便性上勝出。

白話文解釋 — Managed Service for Apache Flink

具備狀態的串流處理屬於那種光看名稱會忽略工程現實的系統。以下三個具體的類比可以幫助您牢記其結構。

類比 1 — 航空交通管制員

想像繁忙機場的航空交通管制員。飛機持續傳送位置更新（輸入 資料流）。管制員腦中有一幅關於每架活躍飛行飛機的圖地圖 — 高度、航向、速度、目的地、上次聯繫時間（這幅地圖就是 Keyed state，每架飛機尾號一個條目）。管制員按降落視窗對飛機進行分組 — 「未來 5 分鐘內降落的所有飛機」 — 以發送許可指令（一個 翻轉視窗）。當飛行員報告遲到或無線電中斷時，管制員不會驚慌；系統對延遲訊息有一定的容忍度（帶有有界失序的浮水印），然後才會宣告飛機失聯。如果管制員的控制台當機，備用控制台會從與中央追蹤系統交換的最新完整快照中恢復地圖（檢查點）。

管制員腦中的地圖正是 Flink 的 Keyed state。5 分鐘降落視窗正是翻轉視窗。對延遲報告的容忍正是浮水印。備用控制台的恢復正是檢查點。嘗試在沒有狀態的情況下進行航空交通管制 — 獨立回答每次飛機傳輸而不記憶之前的內容 — 是不可能的。嘗試在沒有 Flink 狀態的情況下進行即時欺詐評分或工作階段彙總也是同樣的不可能，只是較不直觀。

類比 2 — 餐廳調酒師

想像週五晚上繁忙時段的調酒師。每張飲料訂單一張一張傳來（輸入 資料流）。調酒師在腦中追蹤每位客人的帳單（每個客人的 Keyed state）。調酒師分波次批次處理飲料以進行遞送 — 每 90 秒服務生取走所有準備好的飲料（一個 處理時間翻轉視窗，不過餐飲服務通常需要事件時間，即客人何時下單，而非調酒師何時調完）。當一位客人消失一段時間後又回來時（活動間隙），他們會重新開始一張新帳單（具有 30 分鐘非活動逾時的 工作階段視窗）。如果調酒師在班次中途移交給接班調酒師，他們會傳遞關於每張活躍帳單的書面筆記（用於跨班次狀態遷移的 儲存點）。

具狀態串流處理就是調酒師的思維模型。無狀態處理 — 飲料之間沒有記憶、沒有帳單、沒有工作階段 — 就像是一台自動販賣機。兩者各司其職；但對於持續使用者活動的分析，您需要調酒師模型，這正是 Flink 所提供的。

類比 3 — 醫院心臟監測器

想像 ICU 病床邊的心臟監測器。監測器持續接收心率讀數（輸入 資料流）。它計算每 30 秒更新一次的滾動 5 分鐘平均值（一個 滑動視窗，大小 5 分鐘，滑動 30 秒）。它在記憶體中維護病人的基準節律（Keyed state）。當一個讀數由於感測器臨時故障而延遲 10 秒到達時，監測器會接受它並重新計算（具有允許遲到的有界失序）。如果一個讀數在視窗關閉很久後（例如延遲 5 分鐘）才到達，監測器會將其標記以供人工審查（遲到事件側輸出）。如果監測器重啟，它會從中央監測系統的快照中恢復基準和最近的讀數（檢查點）。

心臟監測器在沒有狀態的情況下無法工作 — 僅知道最新的一次心率而沒有背景資訊是沒有意義的。欺詐、IoT、推薦和運維分析中的串流處理也是如此。Managed Flink 是用於串流資料的現成心臟監測器；在 Lambda 加上 DynamoDB 加上自定義程式碼中構建同等功能，無異於用原始電晶體構建心臟監測器。

Managed Flink 的常見考試陷阱

DEA-C01 考試設定了一組一致的陷阱。請務必記住這五個。

陷阱 1 — 使用 Lambda 進行具狀態串流處理

情境描述「每台設備的滾動 5 分鐘平均值」或「基於工作階段的彙總」，並提供 Lambda 作為無伺服器答案。錯誤。Lambda 是無狀態的 — 滾動平均值需要外部狀態（DynamoDB、ElastiCache）加上複雜的一致性邏輯，或者是 Flink 內建的 Keyed state。正確答案：Managed Flink。

陷阱 2 — 使用 Firehose 進行彙總

情境要求「將每分鐘的事件計數遞送到 S3」，並提供 Kinesis Data Firehose 作為託管答案。錯誤。Firehose 遞送原始記錄；它不執行彙總。正確答案是使用 Managed Flink 執行彙總，然後通過 Firehose 遞送到 S3，或者由 Managed Flink 直接寫入 S3。

陷阱 3 — 當需要事件時間時使用了處理時間

情境描述「帶有時間戳 X 的事件必須位於 X 所屬小時的視窗中，即使它們遲到」。錯誤答案：處理時間視窗化。正確答案：帶有浮水印的事件時間視窗化。處理時間會將遲到事件歸入錯誤的視窗。

陷阱 4 — 忘記檢查點等於沒有容錯能力

情境描述「Flink 應用程式在 TaskManager 故障後重啟，但丟失了最後一小時的彙總」。原因是檢查點被停用或配置錯誤。正確答案是啟用檢查點並設定合適的間隔 — 在 Managed Flink 中預設通常為 1 分鐘。

陷阱 5 — 遲到事件被靜默捨棄

情境描述「下游儀表板顯示的事件少於來源 — 調查顯示事件延遲了 30 秒到達」。原因是 Flink 的預設行為是捨棄超過浮水印的遲到事件。正確答案是為遲到事件配置側輸出或使用允許遲到，而不是增加平行度或分片數量。

關鍵數據與必背事實

Managed Flink 定價

每 KPU 小時 $0.11（每個 KPU 包含 1 vCPU + 4 GB 記憶體）
每個 KPU 包含 50 GB 應用程式存儲
Studio 筆記本：開發環境使用相同的 KPU 小時定價

視窗類型

翻轉 (Tumbling)：固定大小，不重疊
滑動 (Sliding)：固定大小，有滑動間隔，會重疊
工作階段 (Session)：基於活動，具有非活動間隙逾時
全域 (Global)：手動觸發，使用自定義觸發器

時間語義

事件時間 (Event-time)：嵌入在事件中的時間戳（確定的，處理遲到資料安全）
處理時間 (Processing-time)：運算子處的掛鐘時間（較簡單，非確定的）
擷取時間 (Ingestion-time)：來源連接器進入點的時間戳

檢查點預設值 (Managed Flink)

檢查點間隔：預設 1 分鐘
檢查點之間的最小暫停：5 秒
檢查點存儲：AWS 託管的 S3
儲存點 (Savepoints)：手動觸發，用於程式碼升級

編程模型選擇

Flink SQL：最簡單，適用於精通 SQL 的團隊，視窗化彙總
Table API：關係型，具有強類型，Java/Scala
DataStream API：功能最強，複雜具狀態邏輯，自定義整合

DEA-C01 考試重點 — Amazon Managed Service for Apache Flink — 串流處理。 此主題在 DEA-C01 考試中佔有很大權重。請掌握每項 AWS 服務所暴露的權衡取捨、決策邊界以及成本/性能觸發點 — 考試將測試那些依賴於知道哪個服務是錯誤答案而不僅僅是正確答案的情境。

常見問題 (FAQ) — Managed Service for Apache Flink 熱門問題

Q1 — 我應該在什麼時候選擇 Managed Flink 而非 Lambda 或 Firehose？

當需求涉及跨事件的狀態時，請選擇 Managed Flink：例如滾動彙總、基於工作階段的分組、視窗化計算、兩個流之間的聯接、模式檢測、具狀態增強或正好一次串流處理。Lambda 是無狀態的 — 每次調用都從頭開始，狀態僅存在於調用期間。Firehose 僅負責遞送 — 它雖然能通過 Lambda 轉換個別記錄，但無法跨記錄進行彙總。DEA-C01 考試會設定情境，其中需求詞彙是「滾動」、「視窗化」、「工作階段」、「隨時間彙總」或「正好一次」 — 所有這些都指向 Flink。Lambda 適用於無狀態的逐筆記錄轉換；Firehose 適用於無需彙總的託管遞送。

Q2 — 我該如何在 Flink 中處理遲到資料？

有三種選擇。捨棄 (預設)：超過浮水印的事件會被靜默丟棄。成本最低，但會丟失資料 — 僅適用於非關鍵性的彙總。側輸出 (Side output)：將遲到事件路由到單獨的流中，以便進行離線重新處理或稽核。當必須考慮遲到事件但不需要它們更新主結果時很有用。允許遲到 (Allowed lateness)：延長視窗關閉的持續時間，接受並為在遲到視窗內到達的事件重新發送更新後的結果。表達能力最強，但下游取用者必須能處理更新語義。DEA-C01 考試會詢問「來自慢速來源的事件在彙總中缺失」的情境 — 修復方案是這三種處理策略之一，取決於您是能容忍捨棄、需要稽核還是需要更新結果。

Q3 — 事件時間與處理時間有什麼區別？

事件時間使用嵌入在每個事件中的時間戳（由 TimestampAssigner 提取）。視窗定義在事件時間上，因此「14:00 開始的 5 分鐘視窗」包含嵌入時間戳在 14:00 到 14:05 之間的事件，而不論它們何時到達運算子。處理時間使用運算子處的掛鐘時間。相同的視窗定義包含在掛鐘時間 14:00 到 14:05 之間到達運算子的事件。事件時間在重播時能產生確定的結果，並能正確處理遲到資料；處理時間較簡單但非確定。對於大多數分析案例（點擊流、IoT、欺詐、金融），事件時間是正確選擇。DEA-C01 考試會詢問「按事件發生時間分組」(事件時間) vs 「按我們接收時間分組」(處理時間) 的情境。

Q4 — 檢查點如何使 Flink 具備容錯能力？

Flink 定期將所有狀態（Keyed state、Operator state、來源位置）的快照擷取到持久存儲中（在 Managed Flink 中為 S3）。發生故障時，運行環境會重啟應用程式並從上一個完成的檢查點恢復狀態。來源會重新定位到檢查點中擷取的偏移量，因此處理會從中斷處精確恢復。結合支持重播的來源 (KDS, MSK) 和支持事務或等冪寫入的接收器 (S3, Iceberg, 帶有事務的 Kafka)，Flink 實現了端到端的正好一次語義。如果沒有檢查點，故障將導致所有記憶體中的狀態丟失，要麼跳過丟失的工作，要麼從來源最早可用的偏移量重新開始 — 對於生產環境的具狀態處理，這兩者都不可接受。

Q5 — 我該如何擴展 Managed Flink 應用程式？

有兩個擴展軸。平行度 (Parallelism)：每個運算子的平行執行個體數量。針對吞吐量受限的工作負載增加平行度。在應用程式程式碼或通過 Managed Flink 配置顯式設定平行度。KPU：總運算容量（平行度 * 每個任務槽的 KPU 比例）。針對記憶體受限或狀態受限的工作負載增加 KPU。自動擴展會根據觀察到的利用率在配置的上下限內調整 KPU。從 CloudWatch 指標診斷擴展需求：高 CPU 利用率意味著需要更多平行度，檢查點持續時間長意味著需要更多記憶體，高背壓 (backpressure) 則意味著下游運算子是瓶頸。DEA-C01 考試會詢問「Flink 工作落後於輸入速率」的情境 — 答案取決於哪個指標是瓶頸信號。

Q6 — Managed Flink 可以從 MSK 讀取嗎？

可以。Managed Flink 包含一個 Kafka 來源連接器，可以從 MSK 或自管 Kafka 讀取。使用引導伺服器 (bootstrap servers)、主題名稱、取用者群組和還原序列化結構描述配置連接器。連接器會追蹤每個分割區的偏移量，並與 Flink 檢查點整合以實現正好一次。同一個應用程式可以有多個來源 — 一個流來自 KDS，另一個來自 MSK — 並在 Keyed-stream 操作中聯接它們。DEA-C01 考試包含來源為 MSK 且接收器為 S3 (Parquet) 或 OpenSearch 的情境 — Managed Flink 能原生處理這兩個端點。

Q7 — 我應該在什麼時候使用 Managed Flink Studio 而不是生產應用程式？

Studio 用於互動式開發、原型化 Flink SQL 查詢，以及針對即時流驗證視窗化彙總。筆記本環境使用 Apache Zeppelin，支持 Flink SQL、Python、Scala 和 Java 單元格。Studio 不適用於生產環境 — 它是單使用者的，對持續工作負載優化較少，且缺乏警報、自動部署和穩定應用程式 ID 等生產應用程式特性。通過將經過驗證的 Studio 查詢導出為 Flink 應用程式，將其提升到生產環境。DEA-C01 考試會設定情境，其中需求是「資料工程師希望互動式探索串流模式」(Studio) vs 「24x7 運行即時彙總的生產流水線」(Managed Flink 應用程式)。

延伸閱讀 — AWS 官方文件

Managed Service for Apache Flink 的權威 AWS 來源包括：《Managed Service for Apache Flink 開發人員指南》（概念、編程模型、部署、監控）；視窗化文檔（包含程式碼範例的翻轉、滑動、工作階段、全域視窗）；檢查點與快照文檔（配置、儲存點、容錯語義）；擴展文檔（平行度、KPU、自動擴展）；Studio 筆記本文檔（基於 Zeppelin 的 SQL 開發）；以及關於 DataStream 和 Table API 深入探討的更廣泛 Apache Flink 文檔。

AWS 大數據部落格有多篇關於 Flink 具狀態增強、遲到事件處理模式以及 Iceberg 接收器整合的深入探討。AWS Skill Builder 課程 《Exam Prep Standard Course: AWS Certified Data Engineer – Associate (DEA-C01)》 包含涵蓋 Managed Flink 場景的領域 1 模組。AWS Managed Flink GitHub 範例存儲庫包含用於 KDS 來源、MSK 來源、S3 接收器、OpenSearch 接收器和聯接模式的生產級程式碼。flink.apache.org 上的 Apache Flink 文檔是該引擎的上游參考；Managed Flink 特有的行為則是在該基礎之上構建的。

Managed Flink 等於具有事件時間視窗化、檢查點和正好一次語義的具狀態串流處理 — 當跨事件的狀態至關重要時，它是正確的選擇。 這是為 DEA-C01 上每個 Managed Flink 問題準備的必背總結。如果情境詞是「滾動」、「視窗化」、「工作階段」、「聯接兩個流」、「模式檢測」或「具狀態」，答案選 Managed Flink。如果情境是無狀態的過濾或路由，Lambda 更便宜。如果情境是無彙總地託管遞送到 S3/Redshift/OpenSearch，Firehose 更便宜。區分點在於狀態 — Flink 存在的理由就是您的流水線何時需要跨事件的記憶能力。

什麼是 Amazon Managed Service for Apache Flink？

為什麼需要託管串流處理引擎

從 Kinesis Data Analytics 到 Managed Flink

Apache Flink 編程模型

DataStream API — 最底層、最強大

Table API — 宣告式、強類型

Flink SQL — 串流上的純 SQL

選擇編程模型

視窗 (Windowing) — 串流處理的核心

翻轉視窗 (Tumbling Windows) — 固定、不重疊

滑動視窗 (Sliding Windows) — 固定大小、有重疊

工作階段視窗 (Session Windows) — 基於活動

全域視窗 (Global Windows) — 手動觸發

事件時間 (Event-Time) vs 處理時間 (Processing-Time)

處理時間 — 運算子處的時鐘時間

事件時間 — 嵌入在事件中的時間戳記

為什麼事件時間對大多數現實案例勝出

浮水印 (Watermarks) — 處理遲到資料

什麼是浮水印

有界失序 (Bounded Out-of-Orderness) 策略

遲到事件 (Late-Arriving Events)

浮水印生成頻率

具狀態串流處理 (Stateful Stream Processing)

Keyed State — 每個分割區鍵的狀態

Operator State — 每個任務執行個體的狀態

狀態後端 (State Backends)

檢查點 (Checkpoints) — 容錯狀態

儲存點 (Savepoints) — 手動狀態快照

來源 (Sources) 與接收器 (Sinks)

常見來源

常見接收器

連接器配置

平行度與 KPU 擴展

什麼是 KPU

平行度 (Parallelism) 與任務槽 (Task Slots)

自動擴展 (Auto-Scaling)

規模調整指南

Managed Flink vs EMR 上的自管 Flink

Managed Flink 的優勢

EMR Flink 的優勢

何時選擇哪一個

Studio 筆記本 — 互動式 Flink SQL

Studio 提供什麼

Studio vs 生產應用程式

常見整合模式

模式 1 — KDS 到 Flink 到 Firehose 到 S3

模式 2 — MSK 到 Flink 到 OpenSearch

模式 3 — KDS 到 Flink 到 Iceberg

模式 4 — 雙流聯接 (Two-Stream Join)

成本模型

KPU 定價

應用程式存儲

頻寬

與替代方案的成本比較

白話文解釋 — Managed Service for Apache Flink

類比 1 — 航空交通管制員

類比 2 — 餐廳調酒師

類比 3 — 醫院心臟監測器

Managed Flink 的常見考試陷阱

陷阱 1 — 使用 Lambda 進行具狀態串流處理

陷阱 2 — 使用 Firehose 進行彙總

陷阱 3 — 當需要事件時間時使用了處理時間

陷阱 4 — 忘記檢查點等於沒有容錯能力

陷阱 5 — 遲到事件被靜默捨棄

關鍵數據與必背事實

Managed Flink 定價

視窗類型

時間語義

檢查點預設值 (Managed Flink)

編程模型選擇

常見問題 (FAQ) — Managed Service for Apache Flink 熱門問題

Q1 — 我應該在什麼時候選擇 Managed Flink 而非 Lambda 或 Firehose？

Q2 — 我該如何在 Flink 中處理遲到資料？

Q3 — 事件時間與處理時間有什麼區別？

Q4 — 檢查點如何使 Flink 具備容錯能力？

Q5 — 我該如何擴展 Managed Flink 應用程式？

Q6 — Managed Flink 可以從 MSK 讀取嗎？

Q7 — 我應該在什麼時候使用 Managed Flink Studio 而不是生產應用程式？

延伸閱讀 — AWS 官方文件

官方資料來源