本文為您介紹Designer提供的協方差。
在概率論和統計學中,協方差用于衡量兩個變量的總體誤差。方差是協方差的一種特殊情況,即當兩個變量是相同的情況。期望值分別為E(X) =μ與E(Y)=ν的兩個實數,其隨機變量X與Y之間的協方差定義為:cov(X, Y)=E((X - μ) (Y - ν))。
組件配置
您可以使用以下任意一種方式,配置協方差組件參數。
方式一:可視化方式
在Designer工作流頁面配置組件參數。
頁簽 | 參數 | 描述 |
字段設置 | 輸入列 | 選擇輸入列,只支持bigint與double類型。 |
進行調優 | 核心數 | 計算的核心數,如果未配置,則系統自動分配。 |
內存數 | 每個核心的內存,如果未配置,則系統自動分配。單位為MB。 |
方式二:PAI命令方式
使用PAI命令方式,配置該組件參數。您可以使用SQL腳本組件進行PAI命令調用,詳情請參見SQL腳本。
PAI -name cov
-project algo_public
-DinputTableName=maple_test_cov_basic12x10_input
-DoutputTableName=maple_test_cov_basic12x10_output
-DcoreNum=6
-DmemSizePerCore=110;
參數名稱 | 是否必須 | 描述 | 默認值 |
inputTableName | 是 | 輸入表的名稱。 | 無 |
inputTablePartitions | 否 | 輸入表中,參與訓練的分區。系統支持以下格式:
說明 指定多個分區時,分區之間使用英文逗號(,)分隔。 | 輸入表的所有分區 |
outputTableName | 是 | 輸出表名稱。 | 無 |
selectedColNames | 否 | 輸入表選擇列名類型。 | 選擇全部列 |
lifecycle | 否 | 指定輸出表的生命周期。 | 無 |
coreNum | 否 | 計算的核心數,取值范圍為正整數。取值范圍[1, 9999]。 | 默認自動計算 |
memSizePerCore | 否 | 每個核心的內存,取值范圍為1 MB~65536 MB。 | 默認自動計算 |
文檔內容是否對您有幫助?