什麼是 Vertex AI?
統一平台的起源
對於 Google Cloud Digital Leader (CDL) 考試而言,Vertex AI 是您最需要記住的單一 AI/ML 平台名稱。Vertex AI 是 Google Cloud 的統一機器學習平台——一套主控台、一套 API、一組工具,涵蓋從資料準備、實驗、訓練、部署、監控到生成式 AI 的整個 ML 生命週期。在 Vertex AI 出現之前,Google Cloud 客戶必須混用兩個獨立產品:AI Platform(用於以 TensorFlow 或 scikit-learn 撰寫的自訂模型)和 AutoML(用於表格、圖像、文字和影片資料的無程式碼訓練)。這兩個產品各有自己的主控台、SDK 和定價模式。2021 年,Google 將兩者合併為 Vertex AI,此後所有新 ML 功能——Pipelines、Feature Store、Model Garden、Generative AI Studio——都在這個統一平台下發布。
MLOps 是核心商業效益
身為 Cloud Digital Leader,您幾乎不需要撰寫訓練程式碼,但您需要向商業利害關係人說明 Vertex AI 為何能加速 ML 專案,而非在 Compute Engine 上跑原始 TensorFlow 或自行架設 Kubernetes ML 叢集。簡單來說,關鍵在於 MLOps:Vertex AI 對模型從筆記本到生產環境的移動方式有明確的規範,平台負責處理那些無聊卻關鍵的部分——特徵版本控制、實驗追蹤、模型登錄檔、端點自動擴展、漂移監控和可解釋性——讓資料科學團隊能專注於模型本身,而非周邊管線。在 CDL 考試中,您會看到將 Vertex AI 與預訓練 API(當問題是通用性的)以及 BigQuery ML(當資料已在 BigQuery 且團隊熟悉 SQL)對比的題目。了解何時各自是正確答案,是反覆出現的考試規律。如需更廣泛的 AI 背景知識,請參閱 AI 與機器學習基礎概念章節。
白話文解釋
Vertex AI 聽起來很技術,但它描述的其實是一個非常熟悉的日常概念:一個將複雜流程所有環節都整合在同一屋簷下的地方。大多數沒有 Vertex AI 的資料科學團隊,就像一位廚師必須跑三個不同的市場採購食材、租用另一個廚房、再把食物送到餐廳、最後還要自己經營外送服務。Vertex AI 就是讓一切都在同一棟建築內完成的版本。以下幾個類比有助於商業受眾理解這個平台實際上在做什麼。
類比 1 — 中央廚房:從食材到上桌一條龍
想像一間餐廳,主廚走進同一棟建築,就能找到備料所需的一切:冷藏備料室、一排專業爐台、試菜台、擺盤台、出餐口,以及顧客回饋箱。食材從備料室流向爐台再到餐盤,全程不需離開這棟建築。這正是資料科學團隊使用 Vertex AI 的感受。Vertex AI Workbench 是廚房備料區——一個受管的 Jupyter 筆記本環境,資料科學家在此探索資料、撰寫實驗。Vertex AI Training 是爐台——一個完全受管的服務,能在任意規模的 CPU、GPU 或 TPU 上執行自訂訓練作業,無需團隊自行佈建伺服器。Vertex AI Prediction 是擺盤與出餐台——將訓練好的模型部署到自動擴展的 HTTPS 端點(線上預測),或對 Cloud Storage 和 BigQuery 中的大型資料集執行批次推論作業。
這間廚房還有一位記錄每次試菜的二廚:Vertex AI Experiments 追蹤每次訓練執行的參數和結果準確率。備料室確保食材的一致性:Vertex AI Feature Store 集中管理特徵,確保訓練和即時服務使用相同的特徵定義(避免令人頭痛的訓練-服務偏差)。就連外送服務也受到監控:Vertex AI Model Monitoring 監看生產環境中的預測結果,並在輸入資料漂離訓練時發出警示。對 Cloud Digital Leader 的啟示是:Vertex AI 將零散的 ML 管線轉化為單一整合的中央廚房,這正是為什麼專案能在幾週而非幾季內從原型推進到生產環境。
類比 2 — 捷運系統:從進站到出站全程順暢
第二個實用的類比是台北的 MRT(捷運)系統。您搭車時,不需要在不同車站分別購票、安檢、換車、取行李——這些事都在同一套系統內、按照正確順序、在清楚的指示和共用基礎設施下完成。Vertex AI 對 ML 工作流程的運作方式完全相同。Vertex AI Pipelines 相當於捷運的行車控制系統,協調將原始資料轉化為已部署模型的每個步驟順序。一次 pipeline 執行可能是:從 BigQuery 擷取資料、執行資料驗證步驟、以 Vertex AI Training 訓練模型、評估模型、將最佳模型登錄至 Vertex AI Model Registry,最後部署到 Prediction 端點——全部定義為程式碼,可按排程重新執行。
就像捷運有不同路線服務不同目的地,Vertex AI Pipelines 底層支援 Kubeflow Pipelines SDK 和 TensorFlow Extended (TFX),但使用者體驗是統一的。對商業的好處是可重現性:每次模型重新訓練都產生相同的成果物,完整可稽核,元資料由 Vertex ML Metadata 自動捕捉。捷運類比也延伸到營運:就像捷運公布準點率,Vertex AI Pipelines 產生血緣關係圖,精確顯示哪個資料版本、哪個特徵版本、哪個程式碼版本產生了生產環境中的每個模型——對醫療和金融等受監管行業而言不可或缺。
類比 3 — 百貨公司:各樓層各有專家,結帳卻是同一套
第三個有用的圖像是大型百貨公司。每個專櫃都有專業人員——化妝品、3C、男裝、廚具——但顧客在同一個統一結帳台付款,累積同一套點數,拿到同一張發票。Vertex AI 就是一家 ML 能力的百貨公司。AutoML 是給想要不需撰寫程式碼就能獲得模型的商業用戶的專櫃,處理表格、圖像、文字和影片資料。Custom Training 是給帶著自己 TensorFlow、PyTorch 或 scikit-learn 程式碼的資料科學家的專櫃。Model Garden 是販售預建基礎模型的專櫃——Google 自家的 Gemini 系列、Vertex AI 上的 Anthropic Claude、Meta 的 Llama,以及數百個開源模型——一鍵即可部署。Generative AI Studio 是提示工程、微調,以及在基礎模型上建構檢索增強生成(RAG)應用的專櫃。
每個專櫃各有其專長,但統一結帳台是所有 Vertex AI 元件與 Google Cloud 其他服務共用的 IAM、計費、監控和稽核日誌。這代表單一 VPC Service Controls 安全邊界保護所有 Vertex AI 工作負載,單一 Cloud Logging 串流捕捉每次預測,單一計費報告顯示各專案的 ML 支出。對 Cloud Digital Leader 而言,這種統一性就是商業價值所在:客戶不必為每個 ML 步驟購買不同的新創工具,而是獲得一個具備一致治理機制的平台——這是銀行和醫院等受監管企業選擇 Vertex AI 而非自行組合開源元件的主要原因。請參閱 BigQuery 章節,了解 Vertex AI 如何與 BigQuery 緊密整合作為資料來源。
Vertex AI Workbench — 資料科學家的受管筆記本環境
執行個體與使用者自管筆記本
Vertex AI Workbench 是大多數資料科學家的入口點。它提供托管於 Google Cloud 的受管 JupyterLab 環境,有兩種版本:Instances(單一使用者受管筆記本,具備完整 IDE 功能,並與 BigQuery、Cloud Storage 和 Dataproc 無縫整合)和 User-managed notebooks(更高的自訂彈性,客戶自行管理 VM)。資料科學家點擊「新增執行個體」,選擇機器類型和選用的 GPU,兩分鐘內就有一個預裝 TensorFlow、PyTorch、scikit-learn、BigQuery 用戶端和 gcloud 的完整設定 JupyterLab。
快速上線與 BigQuery 整合
關鍵商業效益在於,Workbench 省去了過去讓資料科學入職備感痛苦的數天設定時間。新進人員不需要安裝 CUDA 驅動程式、設定 Python 環境、配置服務帳號,幾分鐘內就能開始探索公司資料。Workbench 執行個體也直接與 BigQuery 整合——資料科學家可在 JupyterLab 側邊欄瀏覽 BigQuery 資料表,將資料表拖入儲存格,再用一個魔法指令(%%bigquery df)立即開始 pandas 分析。這正是受限於本機筆記型電腦的分析師與雲端原生分析師的差距所在。
Vertex AI Training — 任意規模的自訂模型訓練
作業提交與受管基礎設施
Vertex AI Training 是執行自訂訓練作業的受管服務。資料科學家將訓練程式碼(TensorFlow、PyTorch、scikit-learn、XGBoost 或自訂容器)打包,並提交訓練作業,指定機器類型、加速器(CPU / GPU / TPU)、區域和資料集。Vertex AI 佈建基礎設施、執行訓練、將日誌捕捉到 Cloud Logging、將產出的模型成果物寫入 Cloud Storage,並在完成後拆除叢集——全程不需團隊管理 VM 或 Kubernetes。
分散式訓練與超參數調整
對於大型模型,Vertex AI Training 支援跨多台機器和 TPU Pod 的分散式訓練,以及透過 Vertex AI Vizier 的超參數調整——這是 Google 內部使用的同一個貝氏最佳化服務。CDL 層級的訊息是:當企業擁有獨特資料和內部 ML 專業知識時,自訂訓練是正確選擇;缺乏專業知識的團隊應退而使用 AutoML,我們接下來將介紹。
Vertex AI AutoML — 無程式碼模型訓練
支援的資料類型
AutoML 是 Vertex AI 的無程式碼訓練服務。它讓非開發人員只需上傳資料集並點擊幾個按鈕,就能訓練出高品質的自訂模型。AutoML 支援四種主要資料類型:表格(CSV 或 BigQuery 資料的迴歸、分類、預測)、圖像(分類、物件偵測)、文字(分類、實體萃取、情感分析)和影片(分類、動作辨識、物件追蹤)。
底層的神經架構搜尋
在底層,AutoML 使用神經架構搜尋自動為給定資料集找出最佳模型架構和超參數。結果通常與有經驗的資料科學家手動產出的相當,但只需數小時而非數週。在 CDL 考試中,當題目強調「沒有內部 ML 專業知識」、「商業用戶」、「最少程式碼」或「以自訂資料最快實現價值」時,AutoML 就是正確答案。
Vertex AI vs 預訓練 API vs BigQuery ML — 三方決策是 CDL 考試最常見的規律。 當問題是通用性且不需要自訂訓練時,使用預訓練 API(Vision、Speech-to-Text、Translation、Natural Language)。當資料已在 BigQuery 且團隊偏好 SQL(CREATE MODEL ...)時,使用 BigQuery ML。當問題對企業而言是獨特的且需要訂製模型時,使用 Vertex AI(Custom Training 或 AutoML)。參見 https://cloud.google.com/vertex-ai/docs/start/introduction-unified-platform。
Vertex AI Prediction — 線上與批次推論
線上與批次服務模式
模型訓練完成後,必須提供服務。Vertex AI Prediction 提供兩種服務模式。線上預測將模型部署在根據流量自動擴展的低延遲 HTTPS 端點後方——適合即時使用情境,例如銷售點的詐欺評分或網站上的商品推薦。批次預測對 Cloud Storage 或 BigQuery 中的大型資料集執行模型——適合夜間對資料庫中所有客戶進行評分。
Model Registry、流量分割與監控
兩種模式共用同一個 Vertex AI Model Registry,對每個已部署的模型進行版本控制,並將其連結回訓練執行、資料集版本和評估指標。Vertex AI Endpoints 支援流量分割以進行金絲雀發布(例如,將 10% 的請求送到第 2 版模型,90% 仍使用第 1 版),以及模型監控以偵測輸入漂移和預測偏差。對商業受眾而言,這正是「我們訓練了一個模型」和「我們有一個在生產環境中正常運行且有適當防護機制的模型」之間的差距。
Vertex AI Pipelines — ML 工作流程協調
Vertex AI Pipelines 以無伺服器方式執行定義為 Kubeflow Pipelines 或 TFX 的 ML 工作流程。Pipeline 是由步驟組成的有向無環圖(DAG)——擷取資料、驗證綱要、轉換特徵、訓練模型、評估、登錄、部署。每個步驟在自己的容器中執行,輸入和輸出自動追蹤。Pipeline 可以手動觸發、透過 Cloud Scheduler 定期執行,或透過 Eventarc 以事件觸發(例如,當新訓練資料到達 Cloud Storage 時)。
Vertex AI Pipelines 與 Cloud Workflows 或 Cloud Composer 並不相同。 Vertex AI Pipelines 是專為 ML 工作流程打造,具備原生模型和資料集追蹤功能。Cloud Workflows 是用於 API 呼叫和微服務的通用無伺服器協調器。Cloud Composer 是用於通用資料工程的受管 Apache Airflow。在 CDL 考試中,如果情境明確提及 ML 模型訓練和部署,答案是 Vertex AI Pipelines——而非 Cloud Workflows。參見 https://cloud.google.com/vertex-ai/docs/pipelines/introduction。
Vertex AI Feature Store — 集中化特徵管理
特徵是什麼,為何需要集中管理
Vertex AI Feature Store 是 ML 特徵的集中化儲存庫。特徵是從原始資料衍生的可量測屬性——例如「過去 30 天的平均訂單金額」或「過去一小時內的失敗登入次數」。若沒有特徵儲存庫,每個資料科學團隊獨立計算特徵,導致定義不一致,以及令人頭痛的訓練-服務偏差——在一種特徵定義下訓練的模型,在生產環境中卻以略有不同的定義提供服務。
儲存變體:傳統版與 BigQuery 版
Vertex AI Feature Store 透過儲存標準特徵定義並以低延遲提供服務來解決這個問題。有兩種儲存變體:原始 Feature Store(線上 + 離線儲存)和較新的 Feature Store(BigQuery-based),後者使用 BigQuery 作為離線資料來源,並以 Bigtable 進行線上服務。兩者都確保訓練和即時預測使用相同的特徵定義,消除整類的生產環境錯誤。
Vertex AI Model Garden — 基礎模型目錄
Vertex AI Model Garden 是 Google Cloud 上可用的預建基礎模型目錄。它包含 Google 自家的 Gemini 系列(Gemini 1.5 Pro、Gemini 1.5 Flash、Gemini 1.0 Pro)、Google 開放權重模型如 Gemma、第三方模型如 Anthropic 的 Claude(Claude 3.5 Sonnet、Claude 3 Opus、Claude 3 Haiku)、Meta 的 Llama 系列、Mistral,以及來自 Hugging Face 的數百個開源模型。Model Garden 中的每個模型都可以一鍵部署到 Vertex AI 端點、以自訂資料進行微調,或作為檢索增強生成(RAG)應用的基礎。
Vertex AI Studio 是生成式 AI 的入口;Model Garden 是基礎模型的目錄。 Studio 是您撰寫提示、設計範本和微調模型的地方。Model Garden 是您瀏覽和選擇要使用哪個基礎模型的地方——Gemini、Claude、Llama、Gemma、Mistral 和許多開源選項。兩者協同運作:在 Model Garden 選擇模型,再於 Vertex AI Studio 中提示或微調它。參見 https://cloud.google.com/model-garden。
Vertex AI Studio — 生成式 AI 工作空間
四大核心功能
Vertex AI Studio(在較舊的文件中有時稱為 Generative AI Studio)是建構生成式 AI 應用的統一工作空間。它提供四項主要功能:提示設計(互動式提示編輯器,支援並排模型比較)、微調(基礎模型的監督式微調、RLHF 和適配器調整)、嵌入生成(用於語意搜尋的文字和多模態嵌入),以及基礎化和 RAG(透過 Vertex AI Search 或自訂向量資料庫將基礎模型連接到您自己的資料)。
建構生成式 AI 應用的商業流程
對 Cloud Digital Leader 而言,Vertex AI Studio 是回答「我們公司如何在 Google Cloud 上實際建構聊天機器人或內容生成工具」這個問題的答案。流程是:開啟 Vertex AI Studio,從 Model Garden 選擇模型(例如 Gemini 1.5 Pro),在提示設計器中反覆迭代提示,選擇性地以公司特定範例進行微調,然後將提示匯出為應用程式可使用的 API 呼叫。整個流程受到與 Vertex AI 其他部分相同的 IAM 和稽核日誌堆疊的治理,確保企業治理機制得以保留。
MLOps 是 Vertex AI 相較於自建基礎設施的核心商業效益。 在 Compute Engine VM 上執行 TensorFlow 或在 GKE 上自建 Kubeflow 叢集是可行的——但團隊必須自行建構實驗追蹤、特徵版本控制、模型登錄檔、端點自動擴展、漂移監控和可解釋性。Vertex AI 提供所有這些開箱即用的功能,這正是為什麼 CDL 考試情境中提到「受管」、「完全整合」、「最低營運開銷」或「一致治理」時,答案指向 Vertex AI 而非自管替代方案。參見 https://cloud.google.com/vertex-ai/docs/start/introduction-unified-platform。
Vertex AI vs BigQuery ML — 實務比較
BigQuery ML 讓分析師直接在 BigQuery 內使用 SQL 訓練 ML 模型——CREATE MODEL ... OPTIONS(model_type='logistic_reg')。當資料已在 BigQuery、團隊熟悉 SQL,且模型類型屬於支援的演算法(線性迴歸、邏輯迴歸、k-means、矩陣分解、ARIMA 預測、梯度提升樹、深度神經網路和 AutoML Tables)時,這是正確選擇。對於更進階的需求——自訂架構、分散式訓練、GPU/TPU 加速、完整 MLOps 生命週期——Vertex AI 更為合適。
您不必在 BigQuery ML 和 Vertex AI 之間二擇一。 BigQuery ML 可以將模型登錄至 Vertex AI Model Registry,Vertex AI Pipelines 也可以在更大的工作流程中呼叫 BigQuery ML 步驟。成熟的資料團隊通常先由分析師使用 BigQuery ML 進行快速原型設計,再將成功的實驗推進到 Vertex AI 進行具備完整 MLOps 控制的生產部署。參見 https://cloud.google.com/bigquery/docs/bqml-vertex-ai。
Vertex AI vs 預訓練 API — 各自適用的情境?
預訓練 API(Cloud Vision、Cloud Natural Language、Speech-to-Text、Cloud Translation、Document AI)是 Google 訓練的模型,透過簡單的 REST 端點公開。對於資料不需要客製化的通用問題,這些是正確答案。Vertex AI(Custom Training 或 AutoML)則適用於企業特有的問題——專有產品瑕疵、特定產業的文件分類、客戶特定的行為預測。許多生產系統同時使用兩者:預訓練 Vision API 從發票中萃取文字,自訂 Vertex AI 模型再將發票分類至公司特定的廠商類別。
MLOps 是將 DevOps 原則應用於機器學習的一套實踐:資料和模型的版本控制、自動化訓練管線、模型程式碼的持續整合、模型成果物的持續交付、生產環境中模型效能的監控,以及模型退化時的回滾程序。Vertex AI 提供內建的 MLOps 工具——Experiments、Model Registry、Pipelines、Model Monitoring——讓團隊不必從開源元件自行組裝這些能力。參見 https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning。
定價模式與成本考量
元件化定價明細
Vertex AI 定價是以元件為基礎。Workbench 按秒收取底層 VM 費用。Training 按機器小時收費,CPU、GPU 和 TPU 各有不同費率。Prediction 線上端點按節點小時收費(含自動擴展),批次作業按每次預測收費。AutoML 有其自己的訓練小時費率,包含架構搜尋的運算成本。生成式 AI 按每 1,000 個輸入和輸出字元或 token 計費,費率因模型而異(Gemini Pro 比 Gemini Ultra 便宜;Gemini Flash 更便宜)。Pipelines 按每個步驟使用的底層運算收費。Feature Store 按儲存的特徵資料和線上服務節點收費。
CDL 情境的成本最佳化槓桿
對 CDL 層級的建議而言,關鍵成本槓桿是:不使用時關閉 Workbench 執行個體、不需要次秒延遲時使用批次預測而非線上端點、在成本較低的區域排程訓練,以及生成式 AI 工作負載先從 Gemini Flash 開始,再視需求升級到 Gemini Pro。
安全性與治理
IAM、VPC Service Controls、CMEK 與 Private Service Connect
Vertex AI 繼承 Google Cloud 的安全模型。IAM 控制對每個 Vertex AI 資源的存取——資料集、模型、端點、pipeline——具有預定義角色如 roles/aiplatform.user 和 roles/aiplatform.admin。VPC Service Controls 可將所有 Vertex AI API 置於安全邊界內以防止資料外洩。客戶自管加密金鑰(CMEK) 透過客戶透過 Cloud KMS 控制的金鑰加密模型成果物、訓練資料和預測結果。Private Service Connect 允許 Vertex AI Prediction 端點僅透過私有 IP 存取,完全不經公開網際網路。
合規認證與稽核日誌
對受監管行業而言,Vertex AI 符合 HIPAA 資格,支援 PCI DSS、ISO 27001、SOC 1/2/3 和 FedRAMP High。稽核日誌流入 Cloud Logging,在啟用資料存取日誌時捕捉每次 API 呼叫、每次模型部署和每次預測請求。如需雲端原生安全基準的更多資訊,Google Cloud 資料庫章節 涵蓋相關治理原則。
依產業劃分的常見使用情境
零售、金融服務與醫療業
零售業使用 Vertex AI 進行需求預測(AutoML Tables)、個人化推薦(自訂矩陣分解模型)和視覺搜尋(Vertex AI Vision 加自訂嵌入)。金融服務業使用 Vertex AI 進行詐欺偵測(具備低延遲線上預測的自訂 XGBoost 模型)、信用風險評分和文件理解(Document AI 加自訂下游分類器)。醫療業使用 Vertex AI 進行醫療影像分類(基於去識別化影像的自訂 CNN 模型)、臨床試驗配對,以及以核准醫療指南為基礎的面向病患聊天機器人生成式 AI。
製造、媒體與公共部門
製造業使用 Vertex AI 進行預測性維護(感測器資料的時間序列模型)、生產線瑕疵偵測(使用自訂工廠圖像的 AutoML Vision),以及供應鏈最佳化。媒體與娛樂業在 Vertex AI 上使用生成式 AI 進行內容生成、自動摘要和個人化新聞推播。公共部門在嚴格的 CMEK 和 VPC Service Controls 下使用 Vertex AI 提供面向民眾的服務,需具備政府監督要求的完整稽核追蹤。
常見問題
Vertex AI 和 AI Platform 是同一個東西嗎?
不是。AI Platform 是上一代 Google Cloud ML 產品,專注於自訂模型的訓練和服務。2021 年 Google 將 AI Platform 與 AutoML 合併為一個統一平台,稱為 Vertex AI。新專案應使用 Vertex AI;AI Platform 已廢棄。所有新 ML 功能——Pipelines、Feature Store、Model Garden、Generative AI Studio——都在 Vertex AI 內發布,而非舊版 AI Platform。
我應該使用 Vertex AI AutoML 還是 Custom Training?
當團隊缺乏深度 ML 專業知識、資料符合支援的類型(表格、圖像、文字、影片),且實現價值的速度比擠出最後 1% 的準確率更重要時,使用 AutoML。當團隊有能夠撰寫 TensorFlow 或 PyTorch 程式碼的資料科學家、問題需要自訂架構(例如圖神經網路),或模型必須跨大量 GPU 或 TPU Pod 進行超大規模訓練時,使用 Custom Training。
Vertex AI 和 BigQuery ML 有何不同?
BigQuery ML 讓分析師在 BigQuery 內以 SQL 訓練模型,適合資料已在那裡且團隊熟悉 SQL 的情況。Vertex AI 提供完整的 ML 生命週期——Workbench 筆記本、自訂訓練、AutoML、Pipelines、Feature Store、Model Registry、線上和批次預測,以及 Generative AI Studio。兩者互補:BigQuery ML 供分析師快速原型設計;Vertex AI 供生產等級的 MLOps。
Vertex AI Studio 和 Model Garden 有何不同?
Model Garden 是您瀏覽基礎模型的目錄——Gemini、Claude、Llama、Gemma、Mistral 和來自 Hugging Face 的開源模型。Vertex AI Studio 是您實際使用這些模型的工作空間:撰寫提示、以自訂資料微調、生成嵌入,以及建構檢索增強生成(RAG)應用。在 Model Garden 選擇模型,再使用 Vertex AI Studio 提示或調整它。
Vertex AI 支援 Anthropic、Meta 和 Mistral 的模型嗎?
支援。Vertex AI Model Garden 是多模型目錄。Anthropic 的 Claude 系列(3.5 Sonnet、3 Opus、3 Haiku)、Meta 的 Llama 系列、Mistral,以及許多其他第三方和開源模型,都與 Google 自家的 Gemini 系列一起提供。這種多模型策略讓客戶能為每個使用情境選擇最佳模型,而不必離開 Google Cloud 的安全邊界、治理堆疊和統一計費。
Vertex AI 可以在地端執行還是只能在 Google Cloud 上?
Vertex AI 是完全受管的 Google Cloud 服務,在 Google 的區域中執行。對於混合情境,Vertex AI Prediction 模型可以匯出並部署到 Google Distributed Cloud 或透過 Vertex AI Edge Manager 工作流程部署到邊緣裝置。訓練和協調平面仍在 Google Cloud,但當延遲或資料駐留要求時,推論可延伸至地端或邊緣位置。