本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業務造成影響,請務必仔細閱讀。
PAI-TF日志分為工作流運行狀態日志和Logview日志,其中PAI-TF的Logview日志蘊含更多的工作流信息。如果您的工作流在運行過程中報錯,則可以通過該操作查看具體報錯信息。
警告
公共云GPU服務器即將過保下線,您可以繼續提交CPU版本的TensorFlow任務。如需使用GPU進行模型訓練,請前往DLC提交任務,具體操作請參見創建訓練任務。
無論以何種方式提交PAI-TF任務,都可以得到如下圖所示的日志。
序號 | 描述 |
① | 該鏈接日志即為Logview日志,可以在瀏覽器中打開。 |
② | 運行狀態日志。 |
運行狀態日志
運行狀態日志主要展示分布式作業的服務器運行情況。通常以參數1/參數2/參數3/格式展示該日志,其中:
參數1:表示正在計算的節點數。
參數2:表示已經計算結束的節點數。
參數3:表示總的計劃節點數。
實驗進度100%表示實驗已經結束。
Logview日志
Logview日志包含實驗的Debug信息,您可以通過如下方式查看相關日志:
在瀏覽器中打開上圖①中的鏈接,進入如下頁面。
如果工作流報錯查看報錯日志,或需要查看工作流運行過程中代碼Print信息,則雙擊實例。
在Worker運行頁面,可以根據需要選擇查看的Task實例及Worker對應的實例。
如果需要查看代碼運行過程中Print函數打印的信息,則單擊Stdout列下的圖標。
如果需要查看產品報錯信息Debug,則單擊StdErr列下的圖標。
文檔內容是否對您有幫助?