通過數據傳輸服務DTS(Data Transmission Service),可以幫助您將自建MySQL數據庫遷移至PolarDB MySQL版集群。

支持的源數據庫

MySQL與PolarDB MySQL版集群間的遷移,支持源數據庫MySQL為以下類型。本文以有公網IP的自建數據庫為例介紹配置流程,其他類型的源數據庫配置流程與本案例類似。
  • RDS MySQL實例。
  • 以下類型的自建數據庫:
    • 有公網IP的自建數據庫。
    • ECS上的自建數據庫。
    • 通過專線、VPN網關或智能網關接入的自建數據庫。
    • 通過數據庫網關接入的自建數據庫。

前提條件

注意事項

說明
  • 在庫表結構遷移過程中,DTS會將源數據庫中的外鍵遷移到目標數據庫。
  • 在全量遷移和增量遷移過程中,DTS會以Session級別暫時禁用約束檢查以及外鍵級聯操作。若任務運行時源庫存在級聯更新、刪除操作,可能會導致數據不一致。
類型說明
源庫限制
  • 帶寬要求:源庫所屬的服務器需具備足夠出口帶寬,否則將影響數據遷移速率。
  • 待遷移的表需具備主鍵或唯一約束,且字段具有唯一性,否則可能會導致目標數據庫中出現重復數據。
  • 如遷移對象為表級別,且需進行編輯(如表列名映射),則單次遷移任務僅支持遷移至多1000張表。當超出數量限制,任務提交后會顯示請求報錯,此時建議您拆分待遷移的表,分批配置多個任務,或者配置整庫的遷移任務。
  • 如需進行增量遷移,Binlog日志:
    • 需開啟,并且binlog_format為row、binlog_row_image為full。否則預檢查階段提示報錯,且無法成功啟動數據遷移任務。
      重要 如源實例自建MySQL是雙主集群(兩者互為主從),為保障DTS能獲取全部的Binlog日志,則您需開啟參數log_slave_updates。
    • 如為增量遷移任務,DTS要求源數據庫的本地Binlog日志保存24小時以上,如為全量遷移和增量遷移任務,DTS要求源數據庫的本地Binlog日志至少保留7天以上(您可在全量遷移完成后將Binlog保存時間設置為24小時以上),否則DTS可能因無法獲取Binlog而導致任務失敗,極端情況下甚至可能會導致數據不一致或丟失。由于您所設置的Binlog日志保存時間低于DTS要求的時間進而導致的問題,不在DTS的SLA保障范圍內。

  • 源庫的操作限制:
    • 在庫表結構遷移和全量遷移階段,請勿執行庫或表結構變更的DDL操作,否則數據遷移任務會失敗。
    • 如僅執行全量數據遷移,請勿向源實例中寫入新的數據,否則會導致源和目標數據不一致。為實時保持數據一致性,建議選擇結構遷移、全量數據遷移和增量數據遷移。
其他限制
  • 建議源和目標庫的MySQL版本保持一致,以保障兼容性。
  • 執行數據遷移前需評估源庫和目標庫的性能,同時建議業務低峰期執行數據遷移。否則全量數據遷移時DTS占用源和目標庫一定讀寫資源,可能會導致數據庫的負載上升。
  • 由于全量數據遷移會并發執行INSERT操作,導致目標數據庫的表產生碎片,因此全量遷移完成后目標數據庫的表存儲空間會比源實例的表存儲空間大。
  • 請確認DTS對數據類型為FLOAT或DOUBLE的列的遷移精度是否符合業務預期。DTS會通過ROUND(COLUMN,PRECISION)來讀取這兩類列的值。如果沒有明確定義其精度,DTS對FLOAT的遷移精度為38位,對DOUBLE的遷移精度為308位。
  • DTS會嘗試恢復七天之內遷移失敗任務。因此業務切換至目標實例前,請務必結束或釋放該任務,或者將DTS訪問目標實例賬號的寫權限用revoke命令回收掉。避免該任務被自動恢復后,源端數據覆蓋目標實例的數據。
特殊情況
  • 當源庫為自建MySQL時
    • 遷移時源庫進行主備切換,會導致遷移任務失敗。
    • 由于DTS的延遲時間是根據遷移到目標庫最后一條數據的時間戳和當前時間戳對比得出,源庫長時間未執行DML操作可能導致延遲信息不準確。如果任務顯示的延遲時間過大,您可以在源庫執行一個DML操作來更新延遲信息。
      說明 如果遷移對象選擇為整庫,您還可以創建心跳表,心跳表每秒定期更新或者寫入數據。
    • DTS會在源庫定時執CREATE DATABASE IF NOT EXISTS `test`命令以推進Binlog位點。
  • 當目標庫為PolarDB MySQL版時:
    • DTS會自動在PolarDB MySQL版中創建數據庫,如果待遷移的數據庫名稱不符合PolarDB MySQL版的定義規范,您需要在配置遷移任務之前在PolarDB MySQL版中創建數據庫。相關操作,請參見管理數據庫

    • 暫不支持調整全量遷移速率。

費用說明

遷移類型鏈路配置費用公網流量費用
結構遷移和全量數據遷移不收費。通過公網將數據遷移出阿里云時將收費,詳情請參見計費概述
增量數據遷移收費,詳情請參見計費概述

遷移類型說明

  • 庫表結構遷移

    DTS將源庫中遷移對象的結構定義遷移到目標庫。

    說明
    • 目前DTS支持結構遷移的對象為表、視圖、觸發器、存儲過程和存儲函數。
    • 在結構遷移時,DTS會將視圖、存儲過程和函數中的DEFINER轉換為INVOKER。
    • 由于DTS不遷移USER信息,因此在調用目標庫的視圖、存儲過程和函數時,需要對調用者授予讀寫權限。
  • 全量遷移

    DTS將源庫中遷移對象的存量數據,全部遷移到目標庫中。

  • 增量遷移

    DTS在全量遷移的基礎上,將源庫的增量更新數據遷移到目標庫中。通過增量數據遷移可以實現在自建應用不停機的情況下,平滑地完成數據遷移。

支持增量遷移的SQL操作

操作類型SQL操作語句
DMLINSERT、UPDATE、DELETE
DDL
  • ALTER TABLE、ALTER VIEW
  • CREATE FUNCTION、CREATE INDEX、CREATE PROCEDURE、CREATE TABLE、CREATE VIEW
  • DROP INDEX、DROP TABLE
  • RENAME TABLE
  • TRUNCATE TABLE

數據庫賬號的權限要求

數據庫庫表結構遷移全量遷移增量遷移
自建MySQL數據庫SELECT權限SELECT權限增量數據遷移:待遷移對象的SELECT權限

REPLICATION CLIENT、REPLICATION SLAVE、SHOW VIEW

建庫建表的權限,以允許DTS創建庫dts,用于記錄遷移期間的心跳數據

PolarDB MySQL版集群讀寫權限

數據庫賬號創建及授權方法:

操作步驟

  1. 進入遷移任務的列表頁面。
    1. 登錄DMS數據管理服務
    2. 在頂部菜單欄中,單擊集成與開發(DTS)
    3. 在左側導航欄,選擇數據傳輸(DTS) > 數據遷移
    說明 您也可以登錄新版DTS遷移任務的列表頁面
  2. 遷移任務右側,選擇遷移實例所屬地域。
    說明 新版DTS遷移任務列表頁面,需要在頁面左上角選擇遷移實例所屬地域。
  3. 單擊創建任務,配置源庫及目標庫信息。
    警告 選擇源和目標實例后,建議您仔細閱讀頁面上方顯示的使用限制,否則可能會導致任務失敗或數據不一致。
    類別配置說明
    任務名稱

    DTS會自動生成一個任務名稱,建議配置具有業務意義的名稱(無唯一性要求),便于后續識別。

    源庫信息選擇已有的實例
    您可以按實際需求,選擇是否使用已有實例。
    • 如使用已有實例,數據庫信息將自動填入,您無需重復輸入。
    • 如不使用已有實例,您需要輸入下方的數據庫信息。
    數據庫類型選擇MySQL
    接入方式根據源庫的部署位置進行選擇,本文以公網IP為例介紹配置流程。
    說明 當自建數據庫為其他實例類型時,您還需要執行相應的準備工作,詳情請參見準備工作概覽
    實例地區選擇源自建MySQL數據庫所屬地域。
    主機名或IP地址填入源自建MySQL數據庫的訪問地址,本案例中填入公網地址。
    端口填入源自建MySQL數據庫的服務端口(需開放至公網),默認為3306
    數據庫賬號填入源自建MySQL數據庫的賬號,權限要求請參見數據庫賬號的權限要求
    數據庫密碼

    填入該數據庫賬號對應的密碼。

    目標庫信息選擇已有的實例
    您可以按實際需求,選擇是否使用已有實例。
    • 如使用已有實例,數據庫信息將自動填入,您無需重復輸入。
    • 如不使用已有實例,您需要輸入下方的數據庫信息。
    數據庫類型選擇PolarDB MySQL
    接入方式選擇云實例
    實例地區選擇目標PolarDB MySQL版集群所屬地域。
    PolarDB實例ID選擇目標PolarDB MySQL版集群ID。
    數據庫賬號填入目標PolarDB MySQL版集群的數據庫賬號,權限要求請參見數據庫賬號的權限要求
    數據庫密碼

    填入該數據庫賬號對應的密碼。

  4. 配置完成后,單擊頁面右下角的測試連接以進行下一步
  5. 如果您的自建數據庫具備白名單安全設置,您需要復制彈跳框中的DTS服務器IP地址,并加入自建數據庫的白名單安全設置中。然后單擊測試連接以進行下一步
    警告 DTS自動添加或您手動添加DTS服務的公網IP地址段可能會存在安全風險,一旦使用本產品代表您已理解和確認其中可能存在的安全風險,并且需要您做好基本的安全防護,包括但不限于加強賬號密碼強度防范、限制各網段開放的端口號、內部各API使用鑒權方式通信、定期檢查并限制不需要的網段,或者使用通過內網(專線/VPN網關/智能網關)的方式接入。
  6. 配置任務對象及高級配置。
    配置說明
    遷移類型
    • 如果只需要進行全量遷移,請同時選中庫表結構遷移全量遷移
    • 如果需要進行不停機遷移,請同時選中庫表結構遷移全量遷移增量遷移
    說明 如果未選擇增量遷移,為保障數據一致性,數據遷移期間請勿在源實例中寫入新的數據。
    目標已存在表的處理模式
    • 預檢查并報錯攔截:檢查目標數據庫中是否有同名的表。如果目標數據庫中沒有同名的表,則通過該檢查項目;如果目標數據庫中有同名的表,則在預檢查階段提示錯誤,數據遷移任務不會被啟動。

      說明 如果目標庫中同名的表不方便刪除或重命名,您可以更改該表在目標庫中的名稱,請參見庫表列名映射
    • 忽略報錯并繼續執行:跳過目標數據庫中是否有同名表的檢查項。
      警告 選擇為忽略報錯并繼續執行,可能導致數據不一致,給業務帶來風險,例如:
      • 表結構一致的情況下,在目標庫遇到與源庫主鍵的值相同的記錄,則會保留目標庫中的該條記錄,即源庫中的該條記錄不會遷移至目標庫中。
      • 表結構不一致的情況下,可能導致只能遷移部分列的數據或遷移失敗。
    目標庫對象名稱大小寫策略

    您可以配置目標實例中遷移對象的庫名、表名和列名的英文大小寫策略。默認情況下選擇DTS默認策略,您也可以選擇與源庫、目標庫默認策略保持一致。更多信息,請參見目標庫對象名稱大小寫策略

    源庫對象

    源庫對象框中選擇待遷移對象,然后單擊向右小箭頭將其移動至已選擇對象框。

    說明 遷移對象選擇的粒度為schema、表、列。若選擇的遷移對象為表或列,其他對象(如視圖、觸發器、存儲過程)不會被遷移至目標庫。
    已選擇對象
    • 如需更改單個遷移對象在目標實例中的名稱,請右擊已選擇對象中的遷移對象,設置方式,請參見庫表列名單個映射
    • 如需批量更改遷移對象在目標實例中的名稱,請單擊已選擇對象方框右上方的批量編輯,設置方式,請參見庫表列名批量映射
    說明
    • 如果使用了對象名映射功能,可能會導致依賴這個對象的其他對象遷移失敗。
    • 如需設置WHERE條件過濾數據,請在已選擇對象中右擊待遷移的表,在彈出的對話框中設置過濾條件。設置方法請參見通過SQL條件過濾任務數據
    • 如需按庫或表級別選擇遷移的SQL操作,請在已選擇對象中右擊待遷移對象,并在彈出的對話框中選擇所需遷移的SQL操作。支持的操作請參見支持增量遷移的SQL操作
  7. 單擊下一步高級配置,進行高級配置。
    配置說明
    設置告警
    是否設置告警,當遷移失敗或延遲超過閾值后,將通知告警聯系人。
    復制源表Online DDL工具執行過程的臨時表到目標庫
    若源庫使用數據管理DMS(Data Management Service)或gh-ost執行Online DDL變更,您可以選擇是否遷移Online DDL變更產生的臨時表數據。
    重要 DTS任務暫不支持使用pt-online-schema-change等類似工具執行Online DDL變更,否則會導致DTS任務失敗。
    • :遷移Online DDL變更產生的臨時表數據。
      說明 Online DDL變更產生的臨時表數據過大,可能會導致遷移任務延遲。
    • 否,適配DMS Online DDL:不遷移Online DDL變更產生的臨時表數據,只遷移源庫使用數據管理DMS(Data Management Service)執行的原始DDL數據。
      說明 該方案會導致目標庫鎖表。
    • 否,適配gh-ost:不遷移Online DDL變更產生的臨時表數據,只遷移源庫使用gh-ost執行的原始DDL數據,同時您可以使用默認的或者自行配置gh-ost影子表和無用表的正則表達式。
      說明 該方案會導致目標庫鎖表。
    源、目標庫無法連接重試時間
    在遷移任務啟動后,若源庫或目標庫連接失敗則DTS會報錯,并會立即進行持續的重試連接,默認持續重試時間為720分鐘,您也可以在取值范圍(10~1440分鐘)內自定義重試時間,建議設置30分鐘以上。如果DTS在設置的重試時間內重新連接上源庫、目標庫,遷移任務將自動恢復。否則,遷移任務將失敗。
    說明
    • 針對同源或者同目標的多個DTS實例,如DTS實例A和DTS實例B,設置網絡重試時間時A設置30分鐘,B設置60分鐘,則重試時間以低的30分鐘為準。
    • 由于連接重試期間,DTS將收取任務運行費用,建議您根據業務需要自定義重試時間,或者在源和目標庫實例釋放后盡快釋放DTS實例。
    配置ETL功能
    選擇是否配置ETL功能。關于ETL的更多信息,請參見 什么是ETL 流式ETL
    是否去除正反向任務的心跳表sql
    根據業務需求選擇是否在DTS實例運行時,在源庫中寫入心跳SQL信息。
    • :不在源庫中寫入心跳SQL信息,DTS實例可能會顯示有延遲。
    • :在源庫中寫入心跳SQL信息,可能會影響源庫的物理備份和克隆等功能。
  8. 上述配置完成后,單擊頁面下方的下一步保存任務并預檢查
    說明
    • 在遷移任務正式啟動之前,會先進行預檢查。只有預檢查通過后,才能成功啟動遷移任務。
    • 如果預檢查失敗,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
    • 如果預檢查產生警告:
      • 對于不可以忽略的檢查項,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
      • 對于可以忽略無需修復的檢查項,您可以依次單擊點擊確認告警詳情確認屏蔽確定重新進行預檢查,跳過告警檢查項重新進行預檢查。如果選擇屏蔽告警檢查項,可能會導致數據不一致等問題,給業務帶來風險。
  9. 預檢查通過率顯示為100%時,單擊下一步購買
  10. 購買頁面,選擇數據遷移實例的鏈路規格,詳細說明請參見下表。
    類別參數說明
    信息配置鏈路規格

    DTS為您提供了不同性能的遷移規格,遷移鏈路規格的不同會影響遷移速率,您可以根據業務場景進行選擇,詳情請參見數據遷移鏈路規格說明

  11. 配置完成后,閱讀并選中《數據傳輸(按量付費)服務條款》
  12. 單擊購買并啟動,遷移任務正式開始,您可在數據遷移界面查看具體進度。