第 7 章：模型部署與雲端服務

發布於 2026-02-21 02:29

# 第 7 章：模型部署與雲端服務 ## 7.1 為什麼要部署？模型開發只是一個起點，真正的價值在於能夠持續為業務帶來洞察。部署的核心目標有三： 1. **可擴充性** – 隨著使用者數量增長，模型需能承載高併發。 2. **低延遲** – 特別是即時決策場景，延遲往往決定成敗。 3. **可監控性** – 需要能快速偵測概念漂移、效能下降等問題。 > **提示**：在部署前務必使用 **資料增強**（Data Augmentation）與 **模型壓縮**（Quantization、Pruning）降低推論延遲。 ## 7.2 典型的 MLOps 流程 mermaid flowchart TD A[資料管道] --> B[特徵工程] B --> C[模型訓練] C --> D[模型評估] D --> E[模型壓縮] E --> F[模型封裝] F --> G[容器化] G --> H[CI/CD] H --> I[雲端部署] I --> J[監控 & 更新] 1. **資料管道**：ETL 或 ELT，確保數據質量、版本控制。 2. **特徵工程**：使用 `Featuretools` 或自訂 pipeline。 3. **模型訓練**：可在本地 GPU 或雲端 Spot Instance。 4. **模型評估**：使用多重度量（Accuracy、F1、AUC、Latency）。 5. **模型壓縮**：進行量化、剪枝或蒸餾。 6. **模型封裝**：轉成 ONNX、TensorFlow Lite、TorchScript。 7. **容器化**：Dockerfile 只保留必要依賴。 8. **CI/CD**：GitHub Actions、GitLab CI 或 Argo Workflows。 9. **雲端部署**：Kubernetes、Kubeflow、SageMaker、Vertex AI、Azure ML。 10. **監控 & 更新**：Prometheus、Grafana、MLflow Tracking、Feature Store 更新。 ## 7.3 ONNX 之旅：跨框架的模型互通 ONNX（Open Neural Network Exchange）允許將 PyTorch、TensorFlow、scikit‑learn 等框架的模型轉換成一個統一格式，方便在不同環境執行。 python # 範例：將 PyTorch 模型轉為 ONNX import torch model = torch.hub.load('pytorch/vision', 'resnet18', pretrained=True) model.eval() input_sample = torch.randn(1, 3, 224, 224) torch.onnx.export(model, input_sample, "resnet18.onnx", opset_version=11) **優點**： - **靈活性**：可在任何支持 ONNX 的執行環境（CPU、GPU、Edge TPU）上部署。 - **性能**：ONNX Runtime 提供多種加速選項（TensorRT、CUDA、OpenVINO）。 ## 7.4 Edge 推理：Edge TPU 與量化在移動裝置或 IoT 端部署時，資源極其有限。Google 的 Edge TPU 允許將模型量化到 8-bit 或 16-bit，並在專用硬體上執行。 1. **量化**：使用 TensorFlow Lite Converter。 python import tensorflow as tf converter = tf.lite.TFLiteConverter.from_saved_model('saved_model/') converter.optimizations = [tf.lite.Optimize.DEFAULT] tflite_quant_model = converter.convert() with open('model_quant.tflite', 'wb') as f: f.write(tflite_quant_model) 2. **部署**：使用 `edge-tpu-python` 或 `libedgetpu` 直接載入。 > **注意**：量化可能導致精度損失，需在小批量驗證後再上線。 ## 7.5 容器化與自動化 ### Dockerfile 範例 Dockerfile # 基底影像 FROM nvidia/cuda:11.7.1-cudnn8-runtime-ubuntu20.04 # 安裝必要套件 RUN apt-get update && apt-get install -y \ python3-pip python3-dev \ && pip3 install --no-cache-dir \ torch torchvision onnx onnxruntime==1.14.1 \ fastapi uvicorn \ && rm -rf /var/lib/apt/lists/* # 複製模型 COPY resnet18.onnx /app/model.onnx # API 程式 COPY api.py /app/api.py # 暴露 port EXPOSE 8000 # 執行 CMD ["uvicorn", "api:app", "--host", "0.0.0.0", "--port", "8000"] ### FastAPI 推論端點 python # api.py from fastapi import FastAPI, File, UploadFile import onnxruntime as ort import numpy as np from PIL import Image app = FastAPI() session = ort.InferenceSession("/app/model.onnx") input_name = session.get_inputs()[0].name @app.post("/predict") async def predict(file: UploadFile = File(...)): image = Image.open(file.file).convert("RGB") image = image.resize((224,224)) arr = np.array(image).transpose(2,0,1).astype(np.float32) / 255.0 arr = np.expand_dims(arr, 0) logits = session.run(None, {input_name: arr})[0] return {"predictions": logits.tolist()} ## 7.6 雲端部署：選擇雲服務商 | 雲端平台 | 主要優勢 | 典型使用情境 | |----------|----------|---------------| | AWS SageMaker | 完整 MLOps，AutoPilot、Edge Inference | 大規模訓練、端點部署 | | GCP Vertex AI | 強大 Dataflow、Kubeflow 集成 | 企業級資料湖、協同開發 | | Azure ML | Data Catalog、MLOps Pipelines | 微軟生態系統整合 | | Oracle Cloud | GPU 端點、Oracle Autonomous Database | 金融、風控領域 | > **小貼士**：選擇時可參考成本、延遲、合規需求。若需多雲混合，Terraform 及 Pulumi 可維持基礎設施即程式碼。 ## 7.7 監控與模型治理 1. **指標**：Latency、Throughput、CPU/GPU 佔用、記憶體使用、錯誤率。 2. **工具**：Prometheus + Grafana、Azure Monitor、CloudWatch。 3. **概念漂移檢測**：使用 `river` 或 `scikit‑explain` 的 SHAP/ICE 觀察特徵分佈變化。 4. **模型版本控制**：MLflow 或 DVC 儲存模型檔、參數、評估報告。 5. **合規**：使用 Data Privacy Manager、GDPR、CCPA 相關政策，確保模型輸出可審計。 ## 7.8 CI/CD 與版本迭代 yaml # GitHub Actions - CI name: CI on: push: branches: [ main ] jobs: build: runs-on: ubuntu-latest steps: - uses: actions/checkout@v2 - name: Set up Python uses: actions/setup-python@v2 with: python-version: '3.9' - name: Install dependencies run: pip install -r requirements.txt - name: Run tests run: pytest tests/ - name: Build Docker run: docker build -t mymodel:latest . - name: Push to ECR uses: aws-actions/amazon-ecr-login@v1 with: registry: ${{ secrets.AWS_ECR_REGISTRY }} run: | docker tag mymodel:latest ${{ secrets.AWS_ECR_REGISTRY }}/mymodel:latest docker push ${{ secrets.AWS_ECR_REGISTRY }}/mymodel:latest ## 7.9 案例回顧：從客戶推薦到雲端部署 - **模型**：K‑Means + PCA + Auto‑Encoder + Feed‑Forward NN。 - **部署**：將整合模型打包為 ONNX，使用 TensorFlow Lite 量化後部署至 Edge TPU，並在 GCP Vertex AI 上提供 REST API。 - **監控**：設定 Prometheus 收集推論 latency，Grafana 以儀表板呈現。 - **結果**：推論延遲下降 60%，推薦準確率提升 8%。 ## 7.10 小結部署並非終點，而是將洞察轉化為價值的關鍵環節。透過 MLOps 流程、模型壓縮、容器化與雲端服務，分析師可將先進模型安全、可擴充地帶入業務決策。接下來，章節 8 將深入探討 **模型治理與倫理**，確保在自動化的同時維護人類的信任與權益。

第6章無監督式學習與深度學習

第 8 章模型治理與倫理：在自動化浪潮中守護信任