第一章時序資料概論

發布於 2026-02-21 10:57

# 第一章時序資料概論 ## 1.1 時序資料到底是什麼？時序資料（Time‑Series Data）是指以時間為序列索引的觀測值集合。與傳統的「橫向」資料不同，時間序列強調的是**時間順序**與**時間依賴性**。典型的例子有： - 股票價格、匯率 - 氣象觀測（氣溫、降雨量） - 零售銷售額、網路流量在這些場景裡，過去的觀測往往能透露未來走勢的線索，正因為此，我們把「預測」作為時序資料分析的核心任務。 ## 1.2 為什麼要學時序預測？ | 需求 | 例子 | 影響 | |------|------|------| | 業務決策 | 需求預測、庫存管理 | 減少庫存成本、避免缺貨 | | 財務風險 | 風險資產報酬 | 管控風險、調整投資組合 | | 環境監測 | 氣象預報 | 提供天氣警示、計畫排程 | 時間序列分析可以把 **非結構化的時序訊號** 轉化為可量化、可解釋的模型，進而支援策略制定、風險管理與自動化決策。 ## 1.3 時序資料的特徵 1. **趨勢（Trend）**：長期上升或下降的趨勢。 2. **季節性（Seasonality）**：周期性的波動，常見於日、週、月或年。 3. **循環性（Cyclicality）**：比季節性更長且不規則的波動，例如經濟週期。 4. **隨機性（Irregular / Noise）**：無法被其他模式解釋的隨機波動。 5. **結構性變化**：如政策調整、產品上市、自然災害等會導致資料分布突變。了解這些特徵是建立有效模型的前提。 ## 1.4 基本統計概念 | 概念 | 定義 | 作用 | |------|------|------| | **自相關（Autocorrelation）** | 同一序列不同時間點之間的相關性 | 判斷序列是否自相依，決定使用哪種模型 | | **偏自相關（PACF）** | 去除中間時間點影響後的相關性 | 協助選擇 AR 項數 | | **單位根（Unit Root）** | 使序列非平穩的特徵 | 若存在，需做差分處理 | | **平穩（Stationarity）** | 均值、變異數隨時間不變 | 大多數傳統模型假設平穩 | ### 1.4.1 平穩性檢驗常用檢驗方法：ADF（Augmented Dickey–Fuller）與 KPSS。若 ADF 結果拒絕「單位根」假設，且 KPSS 接受「平穩」假設，則序列可視為平穩。 ## 1.5 時序建模流程概覽 > **資料 → 清理 → 探索 → 模型選擇 → 訓練 & 檢驗 → 預測 & 監控** | 步驟 | 主要工作 | 典型工具 | |------|----------|-----------| | 資料 | 載入、格式化、缺失值處理 | `pandas`, `numpy` | | 清理 | 時間索引設置、去除異常 | `pandas` | | 探索 | 描述統計、圖形化、ACF/PACF | `matplotlib`, `seaborn`, `statsmodels` | | 模型 | 選擇 ARIMA、SARIMA、Prophet、LSTM 等 | `statsmodels`, `fbprophet`, `pytorch` | | 檢驗 | 留一法、時間序列交叉驗證 | `scikit‑learn` | | 預測 | 未來值推斷、置信區間 | `statsmodels`, `prophet` | | 監控 | 指標追蹤、再訓練觸發 | `mlflow`, `Prometheus` | ## 1.6 Python 時序工具簡介 | 套件 | 主要功能 | 適用場景 | |------|----------|-----------| | `pandas` | 資料結構與時間序列功能 | 資料清理、切分、重採樣 | | `statsmodels` | ARIMA、SARIMA、VAR 等統計模型 | 經典統計建模 | | `fbprophet` (Prophet) | 可解釋的季節性模型 | 需要快速部署且易於調參 | | `pytorch` | 深度學習模型（LSTM, Transformer） | 大規模序列、非線性關係 | ## 1.7 本書的學習路徑 > **理論基礎 → Python 實作 → 業務案例 → 高級技巧** 1. **理論基礎**：本章及第二章闡述時序概念、統計檢驗與基礎模型。 2. **Python 實作**：第三章到第六章帶你一步步用 `pandas`、`statsmodels` 及 `Prophet` 進行實際預測。 3. **業務案例**：第七章至第九章以金融、氣象、零售三大領域為例，示範模型部署與效能維護。 4. **高級技巧**：第十章到最後，探討深度學習模型、模型自動化與監控框架。 > **提示**：每章結尾都有實作練習，建議讀者自行下載 Kaggle 或開源資料集進行實作，才能真正掌握「從資料到預測」的流程。 ## 1.8 小結本章為時序預測的基礎建構塊，闡述了時序資料的核心概念、典型特徵與統計檢驗方法，並簡要概覽了完整的預測工作流。接下來，我們將進入 **第二章：時序資料的探索性分析（EDA）**，深入了解如何用 Python 針對實際資料進行清洗與可視化，並為後續模型建構打下堅實基礎。

第 2 章：Python 時序資料工具

聊天視窗

第一章 時序資料概論

第一章時序資料概論