examlab .net 用最有效率的方法,考取最有價值的證照
本篇導覽 約 22 分鐘

建模方法選擇 — JumpStart、Bedrock、Autopilot 與自訂訓練

4,250 字 · 約 22 分鐘閱讀 ·

掌握 MLA-C01 Domain 2 Task 2.1 的建模方法選擇決策樹:SageMaker Autopilot vs JumpStart vs Amazon Bedrock vs 自訂訓練、BYOC vs script mode、遷移學習、AWS AI 服務(Rekognition、Comprehend、Forecast),以及 ML 工程師必須掌控的工程取捨——資料量、延遲、成本、客製化、上線時間和運維責任。

立即做 20 題練習 → 免費 · 不用註冊 · MLA-C01

建模方法選擇是每個 ML 專案的第一個工程決策,在 MLA-C01 考試中,它是區分用資料科學家思維思考和用 ML 工程師思維思考的分水嶺。資料科學家問「哪個演算法給出最好的準確率」;ML 工程師問「哪個 AWS 服務能在正確的延遲、成本和運維責任下把可用的模型推到用戶面前」。MLA-C01 考試圍繞工程師的問題建構。Domain 2 Task 2.1(「選擇建模方法」)測試你是否能在 SageMaker Autopilot、SageMaker JumpStart、Amazon Bedrock、自訂 SageMaker 訓練 jobs 和預建的 AWS AI 服務(如 Rekognition、Comprehend 和 Forecast)之間做出選擇——以及你是否能從工程角度而非演算法理論角度為這個選擇辯護。

本指南是 ML 工程師視角的建模方法選擇手冊。它建構決策樹,用具體的取捨解釋每個分支,走過 BYOC vs script mode vs 內建演算法的比較,對比 Amazon Bedrock 與 SageMaker 託管模型,並整理考試在情境題幹中設置的建模方法選擇陷阱。自始至終,重點放在 ML 工程師擁有的內容——管線協調、部署、監控、安全、成本——而非演算法研究員會著迷的數學。

MLA-C01 中建模方法選擇的含義

建模方法選擇是在讓 AWS 管理一切(預建 AI 服務或 Bedrock 管理推理)、讓 AWS 管理大部分加上輕度客製化(Autopilot 或 JumpStart fine-tuning)和直接擁有訓練迴路(內建演算法、script mode 或自帶容器)之間做的工程選擇。定製化階梯每往上爬一級,工程工時成本就更高、運維覆蓋面更大、每次推理的費用通常也更多,但換來對準確率、延遲和資料駐留的更多控制。考試測試你是否能把情境的限制條件匹配到仍然滿足要求的最低階梯。

MLA-C01 為何以與 MLS-C01 不同的方式測試建模方法選擇

Specialty 考試(MLS-C01)測試演算法理論——梯度提升 vs 深度神經網路、SVM 中的 kernel 選擇、Word2Vec 中的 embedding 維度。Associate 考試(MLA-C01)測試服務選擇機制——你選哪個 AWS 服務、運行成本多少、如何部署、運維交接是什麼、繼承了什麼合規姿態。預期 MLA-C01 題幹中有「團隊的 ML 專業有限」、「使用案例需要毫秒以下的延遲」、「資料不能離開 AWS 帳戶」、「客戶希望對自然語言提示生成回應」或「工作負載每季執行一次」等措辭。每個措辭都指向建模方法階梯上的不同級別,你的工作是識別訊號。

五級建模方法階梯

一個清晰的考試心智模型:按誰擁有什麼來排列方法。第一級——預建 AWS AI 服務(Rekognition、Comprehend、Translate、Forecast、Transcribe、Polly、Textract、Personalize):AWS 擁有模型、訓練資料、基礎設施和準確率 SLA;你呼叫一個 API。第二級——Amazon Bedrock 管理推理:AWS 擁有基礎模型和基礎設施;你提供提示並選擇性地微調。第三級——SageMaker JumpStart 和 Autopilot:AWS 提供 curated 演算法或預訓練模型;你提供資料和設定;SageMaker 管理訓練、部署和基礎設施。第四級——帶 script mode 的 SageMaker 內建演算法:AWS 提供框架容器(XGBoost、TensorFlow、PyTorch、MXNet);你提供訓練腳本和超參數。第五級——自帶容器(BYOC):你提供帶有完整訓練堆疊的 Docker image;SageMaker 只提供協調和管理計算。MLA-C01 的正確答案幾乎總是仍然滿足限制條件的最低一級。

白話文解釋建模方法選擇

建模方法選擇是六個 AWS 服務在考生腦中模糊成一團的主題。三個具體類比讓結構更清晰。

類比一 — 外食、料理包、自煮的選擇

想像你需要解決晚餐問題。你有五個選項,按努力程度和客製化程度排列。去連鎖速食店(第一級,Rekognition 等 AWS AI 服務)最快——你付錢,拿到和所有人一樣的漢堡,你不能要求不同的食譜,但兩分鐘就解決。從有管理菜單的精緻外送服務點餐(第二級,Amazon Bedrock)給你由專業廚房準備的頂級食材——你從他們的菜單選,你可以要「更辣一點」(提示工程或輕度 fine-tuning),但你不能選廚師的爐台品牌。訂閱料理包服務(第三級,SageMaker JumpStart 和 Autopilot)給你預先分量好食材加食譜——你烹飪,但重大決定(哪個部位的牛肉、什麼香料比例)已經替你做好了。去超市買食材按食譜自己用鍋烹飪(第四級,帶 script mode 的 SageMaker 內建演算法)代表你控制辣度、熟度、擺盤——但你要自己做。自己種蔬菜、養雞、磨麵粉(第五級,BYOC)代表完全控制和完全的時間投入。

MLA-C01 考試設置如「團隊很小,需要明天就能用的情感分析」——速食(Comprehend)。「我們需要一個用自然英語回答公司政策問題的聊天機器人」——精緻外送(Bedrock)。「我們有表格式客戶流失資料和有限的 ML 專業」——料理包(Autopilot)。「我們需要帶有自訂超參數掃描的 XGBoost 模型」——超市加食譜(帶 script mode 的內建 XGBoost)。「我們有來自博士實驗室的專有研究演算法」——自己種(BYOC)。

類比二 — 叫車、租車、自有車、客製打造的交通決策

你需要帶著貨物從 A 到 B。叫 Uber(第一級,AWS AI 服務)最快——司機、車輛、油料、導航全包;按趟收費;你不能選路線。租一輛有司機的豪華轎車加選擇性客製路線(第二級,Bedrock)給你頂級車輛和司機,但你指定目的地和停靠點。租一輛有 curated 升級選項的車一週(第三級,JumpStart)讓你自己開,有一個已驗證的好模型。買一輛普通轎車並用市售零件客製化(第四級,帶 script mode 的內建演算法)給你所有權和調整空間。買原始底盤和引擎並組裝一輛客製賽車(第五級,BYOC)給你完全控制,付出最大努力。

對形如「客戶需要 30 天內為用戶上傳的圖像進行內容審核,沒有 ML 團隊」的 MLA-C01 題幹,叫車答案是 Rekognition。對「客戶需要一個在內部合約上訓練的生成式法律條款撰寫器」,帶客製路線的禮賓車是 Bedrock 加 RAG 或 fine-tuning。對「客戶需要根據 50 欄內部銷售資料預測下季度營收」,租車升級路徑是 Autopilot。考試想要仍然滿足限制條件的最便宜、管理最多的答案——從不是最強大的那個。

類比三 — 預製模組、現成房屋、客製建築師設計的建設決策

你需要一棟建築。預製模組化結構(第一級,AWS AI 服務)幾天就能建好,只有固定的一種格局。有顏色、裝置和平面設計選項的標準房型目錄(第二級,Bedrock)是批量生產的品質加有限客製化。帶組裝選項的房屋套件(第三級,JumpStart 和 Autopilot)提供帶參數調整的已驗證設計。用你選的材料按已發布計畫建造的建築承包商(第四級,內建演算法或 script mode)是傳統建造。由客製建築師設計用客製藍圖建造的結構(第五級,BYOC)是獨一無二的、昂貴的,需要一年時間。

對 MLA-C01 題幹,「這個衝刺就要上線的解決方案」傾向第一或第二級;「我們有特定準確率目標和表格資料」傾向第三級(Autopilot);「我們有框架專業,想要我們的超參數」傾向第四級(內建或 script mode);「我們有專有演算法或不尋常的框架」傾向第五級(BYOC)。

建模方法決策樹

記住這個決策樹。MLA-C01 考試期待你對每個建模方法情境都走一遍。

步驟一 — 這個用例是否有預建的 AWS AI 服務?

如果使用案例是圖像標記、內容審核、人臉偵測、OCR、情感分析、實體提取、語言翻譯、語音轉文字、文字轉語音、時間序列預測、推薦或文件理解,AWS AI 服務幾乎肯定存在且是正確答案。Rekognition 用於視覺、Comprehend 用於 NLP、Translate 用於翻譯、Transcribe 用於語音轉文字、Polly 用於文字轉語音、Textract 用於表單和表格、Forecast 用於時間序列、Personalize 用於推薦、Kendra 用於企業搜尋。這些服務沒有訓練、沒有模型管理、沒有基礎設施——呼叫 API。考試有時會用「客戶的 ML 團隊很小,截止日期很緊」這樣的題幹來隱藏這個分支;正確答案永遠是識別出使用案例已被管理服務解決,並停止爬階梯。

步驟二 — 使用案例是否是帶基礎模型的生成式 AI?

如果工作負載是文字生成、摘要、自然語言問答、程式碼生成、從提示生成圖像或任何對話式使用案例,正確的起點是 Amazon Bedrock。Bedrock 為來自 Anthropic、Meta、Mistral、Cohere、Stability AI、AI21 和 Amazon Titan 的基礎模型提供管理推理,全部透過一個 API。你按 token 付費。你可以用你的資料對部分模型進行 fine-tuning(客製化層),無需建立訓練基礎設施。替代方案——在 SageMaker 上託管開源 LLM——是第三到第五級的努力,只有在 Bedrock 無法滿足特定需求時才有理由(區域可用性、Bedrock 中沒有的特定開源模型、超出 fine-tuning 的深度模型手術)。

步驟三 — 資料是否是表格、文字或圖像,且團隊是否想要 AutoML?

如果資料是表格、文字或圖像,且團隊偏好 AutoML 而非手動調整,SageMaker Autopilot 是下一站。Autopilot 讀取資料集,推斷問題類型(分類、迴歸、多類),嘗試多種演算法和超參數,返回候選模型的排行榜,並產生可解釋性報告。Autopilot 有三種模式:Auto(讓服務選擇)、超參數最佳化(HPO)模式和 Ensembling 模式。選擇 Autopilot 的正確時機是當團隊接受 AutoML 的演算法選擇且想要快速、良好工程化的基準時。

步驟四 — JumpStart 目錄中是否有匹配的預訓練模型?

JumpStart 是 SageMaker 的 curated 預訓練模型目錄——基礎模型、視覺模型、NLP 模型、表格模型——來自 Hugging Face、Meta、Stability AI 和 AWS 合作夥伴,加上端到端解決方案範本。每個模型可以一鍵部署用於推理、在你的資料上微調,或作為遷移學習基礎。JumpStart 是當你需要特定預訓練架構(例如用於醫療影像的視覺 transformer 或用於生物醫學文字的 BERT 變體)、它在目錄中且部署即用或用你的資料輕度微調的正確答案。

步驟五 — SageMaker 內建演算法是否與問題匹配?

SageMaker 提供 17 個為 AWS 基礎設施調整的內建演算法——表格用 XGBoost、分類或迴歸用 Linear Learner、索引用 k-NN、詞嵌入和文字分類用 BlazingText、時間序列用 DeepAR、配對嵌入用 Object2Vec、圖像分類、物件偵測、語義分割、異常偵測用 Random Cut Forest、IP-實體關聯用 IP Insights、Factorization Machines、Neural Topic Model、LDA、K-means、PCA、Sequence-to-Sequence。如果問題匹配其中之一,內建演算法是正確的第四級答案——管理的框架容器,你提供超參數和 S3 輸入,SageMaker 處理訓練迴路。

步驟六 — 你是否需要帶框架容器的 Script Mode?

當演算法邏輯是自訂的,但框架(TensorFlow、PyTorch、MXNet、scikit-learn、XGBoost)是標準的,script mode 是正確的第四.五級答案。SageMaker 提供預安裝框架執行時的深度學習容器(DLC);你提供使用框架標準 API 的 Python 訓練腳本;SageMaker 把你的腳本掛載到容器中,在管理的 instance 上執行,並把輸出寫入 S3。Script mode 讓你在不自己打包 Docker image 的情況下執行任何 TensorFlow 或 PyTorch 模型。

步驟七 — 你是否需要 BYOC?

最後的手段。當你需要非標準框架、不尋常的作業系統基礎或無法存在於 SageMaker DLC 中的專有依賴時,才需要 Bring-Your-Own-Container。BYOC 意味著你建構一個符合 SageMaker 容器合約的 Docker image(特定的 entrypoint 路徑、超參數文件慣例、輸出路徑),推送到 ECR,SageMaker 把它作為訓練 job 執行。BYOC 繼承了所有運維責任——image 安全修補、依賴升級、容器漏洞掃描。考試很少把你引導到 BYOC;當它這樣做時,題幹會提到排除較低層級的特定內容(「團隊使用 SageMaker DLC 不支援的專有程式庫」、「客戶需要具有自訂 CIS 強化的空隙隔離 image」)。

永遠選擇建模方法階梯上仍然滿足要求的最低一級。 MLA-C01 考試模式是一致的:考生因資料科學訓練使他們偏向自訂訓練而過度設計。考試獎勵識別出 Comprehend 呼叫比精心調整的自訂 transformer 更好的工程師,當使用案例是情感分析時。只有在限制條件真正排除較低層級時才爬階梯——有限的區域可用性、管理服務無法滿足的硬性準確率 SLA、資料駐留要求或專有演算法。每上升一個層級,運維覆蓋面就加倍,讓客戶花費真實的工程工時。

SageMaker Autopilot 深入解析

Autopilot 是 MLA-C01 上測試最多的 AutoML 服務。

Autopilot 自動化的內容

Autopilot 自動化:問題類型偵測(二元分類、多類分類、迴歸)、資料前處理(one-hot 編碼、缺失值填補、縮放)、演算法選擇(XGBoost、Linear Learner、MLP)、超參數調整和模型評估。輸出是按所選指標排名的候選模型排行榜,加上記錄候選生成管線的 notebook(你可以審計和重現選擇)。

Autopilot 模式

  • Ensembling 模式 — 最快,建構 AutoGluon-Tabular ensemble,適合最大 100 GB 的資料集;當速度很重要且資料是表格式時推薦。
  • 超參數最佳化(HPO)模式 — 在基礎學習器上執行 Bayesian 最佳化的超參數搜尋,更慢但產生更強的單一模型結果;對準確率關鍵的表格工作負載推薦。
  • Auto 模式 — Autopilot 根據資料集大小和特性在 Ensembling 和 HPO 之間決定。

文字和圖像的 Autopilot

Autopilot 也支援文字分類(使用微調的 BERT 家族模型)和圖像分類(使用微調的視覺模型)。對文字和圖像,Autopilot 底層使用遷移學習——當團隊有標記的文字或圖像資料但缺乏深度學習框架專業時的正確答案。

Autopilot 可解釋性

每次 Autopilot 執行都會產生 SageMaker Clarify 的 SHAP 可解釋性報告。對需要「此模型的決策可以被解釋」文件的受監管工作負載,Autopilot 是完整的答案,因為可解釋性文件隨每個 job 提供。

何時不使用 Autopilot

Autopilot 是錯誤答案,當使用案例需要 AutoGluon ensemble 中沒有的特定演算法(例如用於非表格序列資料的自訂遞迴網路)、當個別訓練 job 的延遲至關重要(Autopilot 可能執行數小時)、當資料集超過 100 GB(HPO 模式上限 100 GB),或當團隊對與 Autopilot 自動選擇衝突的超參數範圍有強烈意見時。

SageMaker JumpStart 深入解析

JumpStart 目錄類別

  • 基礎模型 — Llama、Mistral、Falcon、Stable Diffusion、BERT 家族。可部署為推理 endpoint;許多可微調。
  • 任務特定模型 — 情感分類、命名實體識別、圖像分類、物件偵測、語義分割;在標準資料集上預訓練,準備好在你的資料上做遷移學習。
  • 解決方案範本 — CloudFormation 部署的端到端解決方案,用於詐騙偵測、需求預測、預測性維護、流失預測;用作參考架構。

JumpStart 一鍵部署

JumpStart 用一鍵把任何目錄模型部署為 SageMaker 即時 endpoint,包括推理容器、模型文件和預調整的超參數。部署的 endpoint 在運維上與任何其他 SageMaker endpoint 相同——自動縮放、監控、模型 registry 整合全都適用。

JumpStart Fine-Tuning

對支援它的模型,JumpStart fine-tuning 以預訓練權重為基礎啟動 SageMaker 訓練 job,以你的 S3 資料集為輸入,帶有合理預設的 curated 超參數。在 JumpStart 上微調 Llama 或 Stable Diffusion 變體比從頭訓練便宜且快速得多。

JumpStart vs Bedrock — 讓考生翻車的比較

JumpStart 和 Bedrock 都提供基礎模型,但所有權模型不同。使用 Bedrock,AWS 在 AWS 管理的基礎設施上託管基礎模型;你不管理 instance;你按 token 付費。使用 JumpStart,你把基礎模型部署到你擁有的 SageMaker endpoint;你為底層 instance 小時付費;你控制 instance 類型、網路隔離和縮放。考試設置題幹,其中正確答案是 Bedrock(無基礎設施、快速上市、區域推理)vs JumpStart(需要 VPC 隔離、需要 Bedrock 中沒有的模型變體、需要對 instance 類型的細粒度控制)。

Amazon Bedrock 和 SageMaker JumpStart 不是可互換的替代品——它們針對不同的運維配置。 Bedrock 是 curated 基礎模型集合的完全管理推理,按 token 定價,無需 instance 管理。JumpStart 把基礎模型部署到你擁有的 SageMaker endpoint,按 instance 小時定價,完全的基礎設施控制。如果題幹提到「最快上市」、「無需管理基礎設施」、「按請求付費」或「ChatGPT 式 API」,答案是 Bedrock。如果題幹提到「VPC 隔離」、「特定 instance 類型」、「Bedrock 中沒有的模型」或「與現有 SageMaker endpoint 模式整合」,答案是 JumpStart。把它們當作沒有區別的替代品是 MLA-C01 上被引用最多的建模方法選擇錯誤。

Amazon Bedrock 用於推理

Bedrock 提供什麼

一個統一的 API 介面(bedrock-runtime:InvokeModelInvokeModelWithResponseStream),用於多家提供商的基礎模型。你選一個模型 ID,發送一個提示,得到一個回應。AWS 管理模型託管、縮放、區域路由和容量。沒有 SageMaker endpoint,沒有 instance,沒有自動縮放設定。

Bedrock 客製化選項

  • 提示工程 — 零成本,透過改變提示結構改變行為。
  • 檢索增強生成(RAG) — 透過知識庫把 Bedrock 連接到你的資料,後者整合了用於向量儲存的 OpenSearch Serverless 或 Aurora;查詢檢索相關上下文,模型用它來讓回應有根據。
  • Fine-tuning — 提供標記範例;Bedrock 產生客製化的模型變體。適用於特定模型。微調後的模型託管在 Provisioned Throughput 基礎設施上。
  • 繼續預訓練 — 對特定基礎模型,繼續在你的領域語料庫上訓練以調整模型的基礎知識。
  • Bedrock Agents — 協調帶工具呼叫的多步驟推理。

Bedrock 是錯誤選擇的時機

Bedrock 是錯誤的,當你需要 Bedrock 目錄中沒有的模型、當你的區域沒有帶你選擇的模型的 Bedrock、當你需要 Bedrock 在按需費率下無法保證的 100ms 以下首 token 延遲、當 fine-tuning 成本超過在你的使用量下的 JumpStart fine-tuning + 專用 endpoint 託管,或當合規要求模型存在於客戶控制的 VPC 內時。

SageMaker 內建演算法 — 工程師快速參考

MLA-C01 考試期待把常見情境匹配到正確的內建演算法。

表格與傳統 ML

  • XGBoost — 結構化表格資料的預設選擇,分類或迴歸。處理缺失值、混合型別特徵、大型資料集。幾乎永遠是「表格結構化資料」的正確答案。
  • Linear Learner — 非常大規模的快速線性分類或迴歸。當資料集有數百萬列且線性基準是目標時的正確答案。
  • k-Nearest Neighbors(k-NN) — 基於索引的檢索、相似性搜尋、推薦基準。
  • Factorization Machines — 稀疏高維資料、點擊率預測。

時間序列

  • DeepAR — 多變量時間序列的自迴歸遞迴網路,帶共變量。當團隊想要預測的 SageMaker 訓練 job 控制時的正確答案;Amazon Forecast 是當團隊偏好無模型管理的管理服務時的正確答案。

文字

  • BlazingText — Word2Vec 嵌入或文字分類。在大規模生產文字分類上快速且具成本效益。
  • Object2Vec — 配對嵌入(用戶-物品、句子對、文件-文件)。用於推薦和語義相似性。
  • Sequence-to-Sequence — 翻譯、摘要、文字生成的編碼器-解碼器;通常對新建構被 Bedrock 或 JumpStart 上的基礎模型取代。

視覺

  • Image Classification — 基於 ResNet,ImageNet 預訓練。
  • Object Detection — Bounding-box 偵測。
  • Semantic Segmentation — 像素級分類。

異常偵測

  • Random Cut Forest — 用於 streaming 和批次資料的無監督異常偵測;與 Kinesis 整合。
  • IP Insights — IP-實體關聯模式的異常偵測;用於安全分析。

對表格結構化資料,XGBoost 幾乎永遠是正確的 SageMaker 內建演算法答案。 XGBoost 處理缺失值、類別特徵(上游帶 one-hot 編碼)、異質數值範圍和類別不平衡,並且以有限的調整始終產生強的基準。MLA-C01 考試會設置帶有「表格式客戶流失資料」或「結構化詐騙特徵」等措辭的題幹,正確演算法是 XGBoost,除非明確的限制條件排除它(極大資料集大小推向 Linear Learner,或對非樹狀模型的硬性要求)。

BYOC vs Script Mode vs 內建演算法

這個三方比較測試很重。

內建演算法

你提供超參數和 S3 輸入資料。SageMaker 提供演算法、容器和訓練迴路。最低工程努力,最窄的客製化範圍。當內建演算法與問題匹配時使用。

Script Mode

你提供 Python 訓練腳本。SageMaker 提供框架特定的深度學習容器(DLC),預安裝了 TensorFlow、PyTorch、MXNet、scikit-learn 或 XGBoost。SageMaker 把你的腳本注入 DLC 並作為訓練 job 執行。中等工程努力,廣泛的客製化範圍。當你需要框架程式碼而不管理容器時使用。

自帶容器(BYOC)

你提供符合 SageMaker 容器合約的 Docker image(trainserve entrypoint、/opt/ml/input/opt/ml/output 路徑、超參數和資源設定文件)。SageMaker 只提供管理計算和協調。最高工程努力,最廣泛的客製化範圍。當沒有框架 DLC 支援你的依賴堆疊時使用。

使用 BYOC 繼承的容器合約

SageMaker BYOC 訓練 image 必須回應 train 呼叫、從 /opt/ml/input/config/hyperparameters.json 讀取超參數、從 /opt/ml/input/data/<channel> 讀取訓練資料、把訓練後的模型寫入 /opt/ml/model,並把訓練指標日誌以 SageMaker 可以抓取的格式寫入標準輸出。服務 image 必須接受 HTTP POST 到 /invocations,並對 /ping 做健康檢查回應。合約有文件記錄,但容易出錯;設定不當的 BYOC image 會產生帶有神秘日誌的靜默失敗。

AWS AI 服務 — 何時預建 API 是正確答案

Amazon Rekognition

圖像和視頻分析:物件/場景偵測、內容審核、人臉偵測和識別、名人識別、圖像中的文字。「我們需要審核用戶上傳的圖像」或「我們需要在行銷資產中偵測標誌」的正確答案——管理的模型、無需訓練、按圖像收費。Custom Labels 讓你在不離開 Rekognition 介面的情況下在你的資料上微調。

Amazon Comprehend

自然語言:情感、關鍵短語提取、實體識別、語言偵測、語法分析、主題建模、PII 偵測。「把客戶評論分類為正面或負面」或「從支援票據中編修 PII」的正確答案。Custom Comprehend 支援在你的資料上微調實體識別或分類。

Amazon Forecast

帶管理 AutoML 管線的時間序列預測。讀取時間序列 CSV,產生帶預測區間的預測。當團隊偏好無模型管理的管理預測服務時的正確答案;替代方案是 SageMaker 上的 DeepAR。

Amazon Personalize

即時個性化推薦。讀取互動歷史,產生部署的推薦 API。「為電子商務網站推薦產品」的正確答案。取代一般推薦使用案例的第四級 Factorization Machines 或 k-NN 方法。

Amazon Textract、Transcribe、Translate、Polly、Kendra

文件理解、語音轉文字、機器翻譯、文字轉語音和企業搜尋的預建 API。每個都是特定問題的單一 API 答案。考試會設置使用案例直接映射到這些服務之一的情境,正確答案是呼叫 API 而非建構自訂模型。

當問題直接映射到其範圍且客戶接受服務的準確率界限時,預建 AWS AI 服務是正確的。 Comprehend 用於情感、Rekognition 用於視覺、Forecast 用於時間序列、Translate 用於翻譯。MLA-C01 考試設置建模方法題幹,即使考生的直覺是「建構自訂模型」,正確答案也是 AI 服務。只有當限制條件排除 AI 服務時才爬到 SageMaker:準確率 SLA 是 AI 服務無法滿足的、不支援的區域、資料必須留在 VPC 中、模型必須客製化超出 AI 服務的客製化層(Custom Labels、Custom Comprehend)所允許的範圍。

遷移學習模式

遷移學習是現代 ML 的主力,出現在多個建模方法中。

用 JumpStart 的遷移學習

最乾淨的路徑。從 JumpStart 目錄選一個預訓練模型(NLP 用 BERT、視覺用 ResNet、生成式用 Llama),提供你的微調資料集,用合理預設設定超參數,啟動微調 job。JumpStart 處理模型載入、凍結或解凍層、訓練新的 head 和打包產生的文件。「我們有小型標記資料集,想利用預訓練模型」的正確答案。

用內建演算法的遷移學習

SageMaker 的 Image Classification、Object Detection 和 Semantic Segmentation 內建演算法透過 use_pretrained_model 超參數原生支援遷移學習——切換它,演算法就從 ImageNet 權重開始。

用 Script Mode 的遷移學習

對框架用戶,script mode 是路徑。在訓練腳本中從 Hugging Face 或 PyTorch Hub 拉取預訓練 checkpoint,凍結適當的層,在你的資料上微調,把文件保存到 /opt/ml/model。訓練腳本是傳統的框架程式碼;SageMaker 的唯一角色是管理計算。

ML 管線中的生成式 AI 整合

SageMaker Pipeline 中的 Bedrock

SageMaker Pipeline 步驟可以呼叫 Bedrock 來產生合成訓練資料、標記非結構化資料或增強下游模型的輸入。模式:Lambda step 或 Processing step 呼叫 bedrock:InvokeModel,把輸出持久化到 S3,下游步驟消費 S3 輸出。IAM 執行角色需要目標模型 ARN 上的 bedrock:InvokeModel

SageMaker 託管 LLM 用於管線使用

當 Bedrock 不可行時(模型不可用、區域不支援、VPC 要求),JumpStart 部署的 LLM endpoint 可以擔任相同的角色。管線步驟呼叫 endpoint,把輸出持久化到 S3,下游步驟消費。

混合 — 生成式加判別式

常見模式:JumpStart 或 Bedrock 生成式模型用於非結構化資料理解,SageMaker XGBoost 分類器在結構化特徵之上做最終決策。這裡的建模方法選擇意味著每個階段選擇正確的工具,而非在整個管線中強制使用一種方法。

MLA-C01 上常見的建模方法選擇陷阱

陷阱一 — 因為聽起來更高大上就預設自訂訓練

最常見的考生錯誤。考試始終獎勵滿足要求的最簡單方法。如果 Comprehend 解決了問題,Comprehend 就是答案。

陷阱二 — 混淆 Bedrock 與 JumpStart

Bedrock 是無基礎設施的管理推理。JumpStart 部署到你擁有的 SageMaker endpoint。提到「無基礎設施」或「按 token 付費」的題幹路由到 Bedrock;提到「VPC 隔離」或「特定 instance 類型」的路由到 JumpStart。

陷阱三 — Script Mode 足夠時選擇 BYOC

如果框架是 TensorFlow、PyTorch、MXNet、scikit-learn 或 XGBoost,script mode 涵蓋它。只有非標準框架或無法存在於 DLC 中的專有依賴才需要 BYOC。

陷阱四 — 忽視資料駐留和 VPC 限制

提到「資料不能離開我們的 VPC」或「我們在 GovCloud 操作」的題幹排除不受 VPC 約束或不在 GovCloud 的服務。Bedrock 可用性和 AI 服務可用性因區域而異;在選擇前檢查限制條件。

陷阱五 — 把 Autopilot 當萬能藥

Autopilot 限制於其支援的問題類型(表格分類/迴歸、文字分類、圖像分類)和資料集大小(HPO 最多 100 GB)。對其他使用案例,Autopilot 是錯誤答案。

陷阱六 — 忘記 Forecast 在許多使用案例中取代 DeepAR

對無需 SageMaker 整合的直接時間序列預測,Amazon Forecast 是更低階梯的答案。DeepAR 是當客戶需要 SageMaker 原生文件時的正確答案。

陷阱七 — 為情感分析選擇 SageMaker 自訂

考試設置明顯直覺是「微調 transformer 做情感分析」的題幹。正確答案幾乎總是 Comprehend(或如果資料是領域特定的,則 Custom Comprehend)。

陷阱八 — 忽略 Custom Labels 和 Custom Comprehend

當 AI 服務開箱即用不匹配時,客製化層(Rekognition Custom Labels、Custom Comprehend)是下一階梯——不是直接跳到 SageMaker 自訂訓練。

陷阱九 — 把基礎模型選擇視為演算法理論

考試不測試哪個基礎模型有最好的困惑度。它測試你是否知道 Bedrock 託管多家提供商、JumpStart 託管不同但有重疊的集合,以及兩者的客製化機制有所不同。

陷阱十 — 把「自訂」等同於「更好」

爬階梯需要工程工時、持續維護和推理成本。考試始終獎勵識別最低可行階梯是正確答案的工程師。

必記建模方法關鍵數字與事實

五級階梯

  • 第一級:AWS AI 服務(Rekognition、Comprehend、Forecast...)
  • 第二級:Amazon Bedrock 管理推理
  • 第三級:SageMaker Autopilot、JumpStart
  • 第四級:SageMaker 內建演算法、script mode
  • 第五級:自帶容器(BYOC)

Autopilot 限制

  • 表格資料集上限:HPO 模式 100 GB
  • 模式:Auto、Ensembling、HPO
  • 問題類型:表格分類/迴歸、文字分類、圖像分類

Bedrock vs JumpStart

  • Bedrock:管理推理、無基礎設施、按 token 定價
  • JumpStart:你擁有的 SageMaker endpoint、按 instance 小時定價、可 VPC 化

BYOC 容器合約

  • train 呼叫 entrypoint
  • 超參數在 /opt/ml/input/config/hyperparameters.json
  • 訓練資料在 /opt/ml/input/data/<channel>
  • 模型輸出在 /opt/ml/model
  • 推理:/invocations POST、/ping 健康檢查

常見 AWS AI 服務

  • Rekognition:視覺(Custom Labels 用於微調)
  • Comprehend:NLP(Custom Comprehend 用於微調)
  • Forecast:時間序列
  • Personalize:推薦
  • Textract:文件和表單
  • Translate、Transcribe、Polly:翻譯、語音轉文字、文字轉語音

MLA-C01 建模方法答案幾乎總是滿足明確限制條件的最低一級階梯。 從限制條件往上建構決策樹,不是從演算法往下。如果題幹說「小團隊、緊截止日期、情感分析」,答案是 Comprehend(第一級)。如果題幹說「對用戶提示的生成式回應、無基礎設施」,答案是 Bedrock(第二級)。如果題幹說「表格流失資料、有限 ML 專業」,答案是 Autopilot(第三級)。如果題幹說「我們有框架專業且想要我們的超參數」,答案是內建演算法或 script mode(第四級)。只有當明確的限制條件排除每個較低層級時才爬到 BYOC(第五級)。考試最一致的模式是獎勵選擇最簡單可行答案的工程師。

MLA-C01 exam priority — 建模方法選擇 — JumpStart、Bedrock、Autopilot 與自訂訓練 — MLA-C01 學習筆記. This topic carries weight on the MLA-C01 exam. Master the trade-offs, decision boundaries, and the cost/performance triggers each AWS service exposes — the exam will test scenarios that hinge on knowing which service is the wrong answer, not just which is right.

FAQ — 建模方法選擇常見問題

Q1 — MLA-C01 題幹何時要求 Amazon Bedrock,何時要求 SageMaker JumpStart?

如果題幹強調「無需管理基礎設施」、「最快上市」、「按 token 付費」或描述 AWS 管理推理可接受的生成式 AI 使用案例,答案是 Bedrock。如果題幹強調「VPC 隔離」、「特定 instance 類型」、「細粒度 instance 縮放」、「Bedrock 中沒有的模型」或「資料必須留在客戶控制的 endpoint 中」,答案是 JumpStart。兩者都可以託管基礎模型;Bedrock 擁有基礎設施並按 token 收費,而 JumpStart 把模型部署到你擁有的 SageMaker endpoint 並按 instance 小時收費。考試通常設置其中一個措辭作為決定性訊號。

Q2 — 答案何時應是預建的 AWS AI 服務而非 SageMaker 自訂訓練?

每當問題直接映射到 AI 服務的範圍且客戶接受服務的準確率界限時。Comprehend 用於情感、關鍵短語提取、實體識別、PII 編修。Rekognition 用於圖像標記、內容審核、人臉偵測。Forecast 用於時間序列。Personalize 用於推薦。Textract 用於文件和表單。MLA-C01 考試始終獎勵即使考生直覺是建構自訂模型也選擇 AI 服務——只有當明確的限制條件(自訂準確率 SLA、區域可用性、VPC 要求或獨特的客製化需求)排除 AI 服務時才爬到 SageMaker。

Q3 — 如何在 SageMaker Autopilot 和像 XGBoost 這樣的內建演算法之間決定?

當團隊想要 AutoML——他們接受 Autopilot 選擇演算法和超參數,並重視記錄選擇的排行榜、可解釋性報告和 notebook 輸出時,Autopilot 是正確答案。當團隊對超參數有意見、想要單一特定演算法,或正在整合到期望 SageMaker 訓練 job 的現有管線時,內建 XGBoost 是正確答案。對團隊 ML 專業有限的表格結構化資料,Autopilot 始終是正確的起始答案;對有經驗的工程師需要控制的表格結構化資料,script 或內建模式的 XGBoost 是正確答案。

Q4 — 何時應使用 BYOC 而非 script mode?

只有當 SageMaker 深度學習容器(DLC)不支援你的框架或依賴堆疊時,才需要 BYOC。DLC 涵蓋 TensorFlow、PyTorch、MXNet、scikit-learn、XGBoost 和 Hugging Face Transformers。如果你的程式碼使用這些框架中的任何一個加上傳統依賴,script mode 是正確答案——你提供 Python 腳本,SageMaker 提供容器。非標準框架、DLC 中沒有的自訂 CUDA 堆疊、帶自訂 CIS 或 FIPS 配置的強化 image 或空隙隔離 image 需要 BYOC。MLA-C01 考試只有在明確的限制條件排除 script mode 時才路由到 BYOC;預設使用 BYOC 會增加大量運維負擔(image 修補、漏洞掃描、依賴升級),考試期待你識別這一點。

Q5 — 如何在 Amazon Forecast 和 SageMaker DeepAR 之間決定?

Forecast 是管理服務答案——無模型管理、無 SageMaker 訓練 job、多演算法的 AutoML、部署的預測 API。當團隊想要帶最少 ML 專業和無 SageMaker 管線整合的預測解決方案時的正確答案。DeepAR 是 SageMaker 內建演算法——你訓練、你部署到 SageMaker endpoint、你整合到 SageMaker 管線、你控制模型文件生命週期。當客戶需要 SageMaker 原生文件、使用案例與其他 SageMaker 組件整合(Feature Store、Model Registry、Model Monitor),或客戶想要控制訓練-部署-監控迴路時的正確答案。

Q6 — JumpStart fine-tuning 和 Bedrock fine-tuning 有什麼不同?

JumpStart fine-tuning 執行 SageMaker 訓練 job——你從 JumpStart 目錄選一個預訓練模型,提供你的 S3 資料集,設定超參數,啟動 job,結果是你部署到 SageMaker endpoint 的 SageMaker 模型文件。你擁有產生的 endpoint、instance 小時和運維生命週期。Bedrock fine-tuning 在 Bedrock 的管理介面內執行——你選一個支援 fine-tuning 的 Bedrock 模型,提供標記資料集,Bedrock 產生託管在 Provisioned Throughput 上的客製化模型變體。你不管理 instance,但你承諾 Provisioned Throughput 計畫來託管微調後的變體。決策:JumpStart fine-tuning 給你控制和按 instance 定價;Bedrock fine-tuning 給你管理介面和 Provisioned Throughput 定價。根據客戶優先考慮基礎設施控制還是運維簡易性來選擇。

Q7 — 一個題幹說「客戶需要從數百萬個客戶支援票據中提取實體和 PII」。哪種建模方法?

Amazon Comprehend,第一級。具體是 DetectEntitiesDetectPiiEntities API(或針對所隱含的量的批次 job)。如果實體類型是領域特定且標準模型遺漏了它們,Custom Comprehend 是下一階梯。在 SageMaker 上建構自訂 NER 模型是 Associate 層級的錯誤答案——它增加了工程努力、訓練基礎設施、持續維護和運維責任,而這個問題已經被管理服務解決了。MLA-C01 考試反覆設置這個確切的題幹模式;正確答案始終是 AI 服務,除非明確的限制條件迫使你往上爬。

延伸閱讀 — 建模方法選擇官方 AWS 文件

權威的 AWS 來源包括:SageMaker Developer Guide(尤其是內建演算法參考、JumpStart 文件、Autopilot 文件和 Bring-Your-Own-Container 文件)、Amazon Bedrock User Guide(尤其是模型選擇指南和客製化文件),以及各個 AI 服務 developer guide(Rekognition、Comprehend、Forecast、Personalize、Textract)。AWS Well-Architected Machine Learning Lens 提供 MLA-C01 借鑒的建模方法決策框架。AWS re:Invent 和 re:MARS 關於「選擇正確的 ML 服務」的議題提供了反映考試題幹的額外決策樹素材。AWS Machine Learning Blog 有關於「從 AI 服務到 SageMaker」遷移案例研究的悠久歷史,說明了爬階梯的模式,AWS Solutions Library 託管展示建模方法決策的生產架構參考實作。

官方資料來源

更多 MLA-C01 主題