聊天視窗

掌握時序預測:Python 與統計學的實務指南 - 第 1 章

第一章 時序資料概論

發布於 2026-02-21 10:57

# 第一章 時序資料概論 ## 1.1 時序資料到底是什麼? 時序資料(Time‑Series Data)是指以時間為序列索引的觀測值集合。與傳統的「橫向」資料不同,時間序列強調的是**時間順序**與**時間依賴性**。典型的例子有: - 股票價格、匯率 - 氣象觀測(氣溫、降雨量) - 零售銷售額、網路流量 在這些場景裡,過去的觀測往往能透露未來走勢的線索,正因為此,我們把「預測」作為時序資料分析的核心任務。 ## 1.2 為什麼要學時序預測? | 需求 | 例子 | 影響 | |------|------|------| | 業務決策 | 需求預測、庫存管理 | 減少庫存成本、避免缺貨 | | 財務風險 | 風險資產報酬 | 管控風險、調整投資組合 | | 環境監測 | 氣象預報 | 提供天氣警示、計畫排程 | 時間序列分析可以把 **非結構化的時序訊號** 轉化為可量化、可解釋的模型,進而支援策略制定、風險管理與自動化決策。 ## 1.3 時序資料的特徵 1. **趨勢(Trend)**:長期上升或下降的趨勢。 2. **季節性(Seasonality)**:周期性的波動,常見於日、週、月或年。 3. **循環性(Cyclicality)**:比季節性更長且不規則的波動,例如經濟週期。 4. **隨機性(Irregular / Noise)**:無法被其他模式解釋的隨機波動。 5. **結構性變化**:如政策調整、產品上市、自然災害等會導致資料分布突變。 了解這些特徵是建立有效模型的前提。 ## 1.4 基本統計概念 | 概念 | 定義 | 作用 | |------|------|------| | **自相關(Autocorrelation)** | 同一序列不同時間點之間的相關性 | 判斷序列是否自相依,決定使用哪種模型 | | **偏自相關(PACF)** | 去除中間時間點影響後的相關性 | 協助選擇 AR 項數 | | **單位根(Unit Root)** | 使序列非平穩的特徵 | 若存在,需做差分處理 | | **平穩(Stationarity)** | 均值、變異數隨時間不變 | 大多數傳統模型假設平穩 | ### 1.4.1 平穩性檢驗 常用檢驗方法:ADF(Augmented Dickey–Fuller)與 KPSS。若 ADF 結果拒絕「單位根」假設,且 KPSS 接受「平穩」假設,則序列可視為平穩。 ## 1.5 時序建模流程概覽 > **資料 → 清理 → 探索 → 模型選擇 → 訓練 & 檢驗 → 預測 & 監控** | 步驟 | 主要工作 | 典型工具 | |------|----------|-----------| | 資料 | 載入、格式化、缺失值處理 | `pandas`, `numpy` | | 清理 | 時間索引設置、去除異常 | `pandas` | | 探索 | 描述統計、圖形化、ACF/PACF | `matplotlib`, `seaborn`, `statsmodels` | | 模型 | 選擇 ARIMA、SARIMA、Prophet、LSTM 等 | `statsmodels`, `fbprophet`, `pytorch` | | 檢驗 | 留一法、時間序列交叉驗證 | `scikit‑learn` | | 預測 | 未來值推斷、置信區間 | `statsmodels`, `prophet` | | 監控 | 指標追蹤、再訓練觸發 | `mlflow`, `Prometheus` | ## 1.6 Python 時序工具簡介 | 套件 | 主要功能 | 適用場景 | |------|----------|-----------| | `pandas` | 資料結構與時間序列功能 | 資料清理、切分、重採樣 | | `statsmodels` | ARIMA、SARIMA、VAR 等統計模型 | 經典統計建模 | | `fbprophet` (Prophet) | 可解釋的季節性模型 | 需要快速部署且易於調參 | | `pytorch` | 深度學習模型(LSTM, Transformer) | 大規模序列、非線性關係 | ## 1.7 本書的學習路徑 > **理論基礎 → Python 實作 → 業務案例 → 高級技巧** 1. **理論基礎**:本章及第二章闡述時序概念、統計檢驗與基礎模型。 2. **Python 實作**:第三章到第六章帶你一步步用 `pandas`、`statsmodels` 及 `Prophet` 進行實際預測。 3. **業務案例**:第七章至第九章以金融、氣象、零售三大領域為例,示範模型部署與效能維護。 4. **高級技巧**:第十章到最後,探討深度學習模型、模型自動化與監控框架。 > **提示**:每章結尾都有實作練習,建議讀者自行下載 Kaggle 或開源資料集進行實作,才能真正掌握「從資料到預測」的流程。 ## 1.8 小結 本章為時序預測的基礎建構塊,闡述了時序資料的核心概念、典型特徵與統計檢驗方法,並簡要概覽了完整的預測工作流。接下來,我們將進入 **第二章:時序資料的探索性分析(EDA)**,深入了解如何用 Python 針對實際資料進行清洗與可視化,並為後續模型建構打下堅實基礎。