SQL 診斷功能旨在分析和診斷 TopSQL、SlowSQL 和可疑 SQL,幫助您優化數據庫性能。
基本概念
SQL 診斷的基本概念如下:
TopSQL:是指在指定時間范圍內整體響應時間最長的 SQL 語句。
SlowSQL:是指執行時間超過 500ms 的 SQL 語句。
可疑 SQL:是指根據規則、算法篩選出的可能導致性能問題的 SQL 語句。
目前,系統對標準版(Key-Value)集群實例有如下限制:
對于版本號大于等于 4.2.4 但小于 4.3.0 的 KV 集群實例,支持顯示 TopSQL 和 SlowSQL 的診斷信息。
對于其他版本的 KV 集群實例,僅支持顯示 SlowSQL 的診斷信息。
TopSQL
TopSQL 是指在指定時間范圍內整體響應時間最長的 SQL 語句。
單擊快捷篩選項,例如 全表掃描、多分區掃描 等,快速識別出需要優化的 SQL。
單擊 操作 列的 查看樣本,可以查看該 SQL 語句。
單擊 SQL 文本前的 +,查看 最后一次報錯 和 統計時段內報錯匯總。
單擊列表右上方的 查看優化建議,可跳轉至優化中心查看優化建議。
單擊列表右上方的 TopSQL 對比,可以對比相同 SQL 在同一個節點的不同時段或在不同節點上的運行情況。
不同時段對比:將同一節點上相同 SQL 在基準和對比時段的運行情況進行對比,然后查看 明細數據對比 和 性能趨勢對比 信息。
不同節點對比:將相同 SQL 在基準節點與其他節點的運行情況進行對比,然后查看 明細數據對比 和 響應時間趨勢對比 信息。
說明相同 SQL 是指相同的數據庫和 SQL ID。
當不同節點對比時,只有不同節點上執行相同 SQL 才會輸出結果。
當發現某個節點 CPU 負載過高時,可以先篩選 數據庫 和 節點,然后根據 CPU 時間 對 SQL 進行降序排序,從而識別出最需要優化的 SQL。
SlowSQL
SlowSQL 是指執行時間超過 500ms 的 SQL 語句。
單擊快捷篩選項,例如 全表掃描、多分區掃描 等,快速識別出需要優化的 SQL。
單擊 操作 列的 查看樣本,可以查看該 SQL 語句。
可疑 SQL
可疑 SQL 是指根據規則、算法篩選出的可能導致性能問題的 SQL 語句。以下是常見的診斷結果及處理建議:
診斷結果 | 處理建議 |
Hint 未生效 | 異常 SQL,需要 DBA 確認是否使用 OUTLINE 進行執行計劃固化。 |
全表掃描性能較差 | 請分析執行計劃和表結構,確認 SQL 有合適的索引可用。 |
走索引但性能比較低 | 請確認業務場景是否可以接受此性能,若不可接受請改進業務邏輯或優化索引。 |
性能比以前下降 | 請確認數據分布變化、請求量突漲、執行計劃變化等情況。 |
執行計劃變動且性能下降 | 需 DBA 確認,可使用 OUTLINE 進行執行計劃固化,以判斷是否為異常 SQL。 |
執行次數突刺 | 需確認業務量,可能導致整體性能下降。 |
CPU 負載過高 | 請確認業務場景、數據分布變化、請求量突漲、執行計劃變化等情況。 |
疑似鎖沖突 | SQL 存在重試,可能是鎖沖突導致,請排查業務邏輯,是否存在鎖沖突場景。 |
DML 訪問過多分區數 | 請改寫 SQL,保證 SQL 能進行分區裁剪。 |
疑似 Buffer 表 | 請確認相關表是否在頻繁更新。 |
疑似存在大小賬號 | 請排查是否存在數據傾斜問題。 |
執行計劃不穩定 | 請排查是否存在計劃惡化的問題。 |
計劃生成時間過長 | 請排查是否存在計劃命中率低等問題。 |
可疑 SQL 頁簽展示了 SQL 文本、SQL ID、數據庫、診斷結果 等信息。