---
title: 商家平台服務故障排除手冊
category: dd
severity: P2
keywords: 商家平台, 折抵, 折抵券,活動折扣碼,發票折抵,車號折抵,通行折抵,停車通行折抵
last_updated: 2025-10-13
version: "1.2"
---
# 商家平台服務故障排除手冊
## 1. 架構與服務邊界 (Architecture & Service Scope)
1. TPKP.API(REST API/GraphQL)
2. TPKP.JOB(Hangfire 背景作業)
3. TPKP.StoreWeb(商家平台)
## 2. 常見故障徵兆(分層) (Common Symptoms)
- 登入/認證:無法登入、403/401
- 折抵券折抵/發票折抵/車號折抵/通行折抵/活動折扣碼:折抵失敗、商家統編未下派至地端、查無此車號的進場紀錄、查無折抵券
- 報表:報表異常
- API/背景作業:API 5xx/4xx、Hangfire 任務失敗、作業未執行
- 系統效能:回應超時、SLA 不符、Redis/SQL 連線異常
## 3. 初步診斷步驟 (Initial Diagnosis)
1. 執行 `kubectl get pods -n ddservice`,檢查 Pod 狀態。
2. 執行 `kubectl logs ...`,查看服務日誌。
3. 登入 Hangfire Dashboard,檢查失敗任務。
4. 檢查 SQL 連線與慢查。
5. 查閱 NLog/ELK 日誌,搜尋 error/exception。
6. 檢查 Swagger/GraphQL `/hc` 健康檢查。
7. 檢查 Azure DevOps pipeline 狀態。
8. 檢查 PMP/PSOP/TPKP 外部 API 連線與回應。
## 4. 進階排查步驟 (Advanced Troubleshooting)
1. 檢查 EF Core 查詢,優化 Include(N+1 問題)。
2. 檢查 Redis/IMemoryCache 設定(快取失效)。
3. 查詢資料庫稽核、比對日誌(資料遺失)。
4. 檢查 Hangfire/背景作業排程(訊息佇列延遲)。
5. 檢查 Prometheus/Grafana 指標(API SLA 不符)。
## 5. Safe Operations (安全操作)
1. 執行 `kubectl get pods -n ddservice` 查詢服務狀態。
2. 執行 `kubectl logs ...` 查詢日誌。
3. 查詢 Hangfire Dashboard 狀態。
4. 查詢資料庫稽核。
---