返回目錄
A
掌握時序預測:Python 與統計學的實務指南 - 第 1 章
第一章 時序資料概論
發布於 2026-02-21 10:57
# 第一章 時序資料概論
## 1.1 時序資料到底是什麼?
時序資料(Time‑Series Data)是指以時間為序列索引的觀測值集合。與傳統的「橫向」資料不同,時間序列強調的是**時間順序**與**時間依賴性**。典型的例子有:
- 股票價格、匯率
- 氣象觀測(氣溫、降雨量)
- 零售銷售額、網路流量
在這些場景裡,過去的觀測往往能透露未來走勢的線索,正因為此,我們把「預測」作為時序資料分析的核心任務。
## 1.2 為什麼要學時序預測?
| 需求 | 例子 | 影響 |
|------|------|------|
| 業務決策 | 需求預測、庫存管理 | 減少庫存成本、避免缺貨 |
| 財務風險 | 風險資產報酬 | 管控風險、調整投資組合 |
| 環境監測 | 氣象預報 | 提供天氣警示、計畫排程 |
時間序列分析可以把 **非結構化的時序訊號** 轉化為可量化、可解釋的模型,進而支援策略制定、風險管理與自動化決策。
## 1.3 時序資料的特徵
1. **趨勢(Trend)**:長期上升或下降的趨勢。
2. **季節性(Seasonality)**:周期性的波動,常見於日、週、月或年。
3. **循環性(Cyclicality)**:比季節性更長且不規則的波動,例如經濟週期。
4. **隨機性(Irregular / Noise)**:無法被其他模式解釋的隨機波動。
5. **結構性變化**:如政策調整、產品上市、自然災害等會導致資料分布突變。
了解這些特徵是建立有效模型的前提。
## 1.4 基本統計概念
| 概念 | 定義 | 作用 |
|------|------|------|
| **自相關(Autocorrelation)** | 同一序列不同時間點之間的相關性 | 判斷序列是否自相依,決定使用哪種模型 |
| **偏自相關(PACF)** | 去除中間時間點影響後的相關性 | 協助選擇 AR 項數 |
| **單位根(Unit Root)** | 使序列非平穩的特徵 | 若存在,需做差分處理 |
| **平穩(Stationarity)** | 均值、變異數隨時間不變 | 大多數傳統模型假設平穩 |
### 1.4.1 平穩性檢驗
常用檢驗方法:ADF(Augmented Dickey–Fuller)與 KPSS。若 ADF 結果拒絕「單位根」假設,且 KPSS 接受「平穩」假設,則序列可視為平穩。
## 1.5 時序建模流程概覽
> **資料 → 清理 → 探索 → 模型選擇 → 訓練 & 檢驗 → 預測 & 監控**
| 步驟 | 主要工作 | 典型工具 |
|------|----------|-----------|
| 資料 | 載入、格式化、缺失值處理 | `pandas`, `numpy` |
| 清理 | 時間索引設置、去除異常 | `pandas` |
| 探索 | 描述統計、圖形化、ACF/PACF | `matplotlib`, `seaborn`, `statsmodels` |
| 模型 | 選擇 ARIMA、SARIMA、Prophet、LSTM 等 | `statsmodels`, `fbprophet`, `pytorch` |
| 檢驗 | 留一法、時間序列交叉驗證 | `scikit‑learn` |
| 預測 | 未來值推斷、置信區間 | `statsmodels`, `prophet` |
| 監控 | 指標追蹤、再訓練觸發 | `mlflow`, `Prometheus` |
## 1.6 Python 時序工具簡介
| 套件 | 主要功能 | 適用場景 |
|------|----------|-----------|
| `pandas` | 資料結構與時間序列功能 | 資料清理、切分、重採樣 |
| `statsmodels` | ARIMA、SARIMA、VAR 等統計模型 | 經典統計建模 |
| `fbprophet` (Prophet) | 可解釋的季節性模型 | 需要快速部署且易於調參 |
| `pytorch` | 深度學習模型(LSTM, Transformer) | 大規模序列、非線性關係 |
## 1.7 本書的學習路徑
> **理論基礎 → Python 實作 → 業務案例 → 高級技巧**
1. **理論基礎**:本章及第二章闡述時序概念、統計檢驗與基礎模型。
2. **Python 實作**:第三章到第六章帶你一步步用 `pandas`、`statsmodels` 及 `Prophet` 進行實際預測。
3. **業務案例**:第七章至第九章以金融、氣象、零售三大領域為例,示範模型部署與效能維護。
4. **高級技巧**:第十章到最後,探討深度學習模型、模型自動化與監控框架。
> **提示**:每章結尾都有實作練習,建議讀者自行下載 Kaggle 或開源資料集進行實作,才能真正掌握「從資料到預測」的流程。
## 1.8 小結
本章為時序預測的基礎建構塊,闡述了時序資料的核心概念、典型特徵與統計檢驗方法,並簡要概覽了完整的預測工作流。接下來,我們將進入 **第二章:時序資料的探索性分析(EDA)**,深入了解如何用 Python 針對實際資料進行清洗與可視化,並為後續模型建構打下堅實基礎。