列數(shù)據(jù)轉(zhuǎn)向量
將多列數(shù)據(jù)轉(zhuǎn)換為向量,最終生成的數(shù)據(jù)只包含一列。
使用限制
支持的計(jì)算引擎為MaxCompute和Flink。
算法簡(jiǎn)介
將數(shù)據(jù)格式從列數(shù)據(jù)轉(zhuǎn)成Vector,數(shù)據(jù)格式必須為數(shù)值類(lèi)型。
可視化配置參數(shù)
【輸入樁配置】
輸入樁(從左到右) | 限制數(shù)據(jù)類(lèi)型 | 建議上游組件 | 是否必選 |
數(shù)據(jù) | 數(shù)值類(lèi)型 | 是 |
【右側(cè)參數(shù)表單】
頁(yè)簽 | 參數(shù) | 描述 |
字段設(shè)置 | 算法保留列名 | 組件輸出中需要保留的列名,默認(rèn)保留所有列。 |
選中的列名數(shù)組 | 需要轉(zhuǎn)換為向量的數(shù)據(jù)列名,只支持?jǐn)?shù)值類(lèi)型。 | |
參數(shù)設(shè)置 | 向量列名 | 新生成向量列的列名。 |
解析異常處理策略 | 取值如下:
| |
向量長(zhǎng)度 | 向量長(zhǎng)度,默認(rèn)-1。 | |
執(zhí)行調(diào)優(yōu) | 節(jié)點(diǎn)個(gè)數(shù) | 與單個(gè)節(jié)點(diǎn)內(nèi)存大小參數(shù)配對(duì)使用。取值為[1, 9999]的正整數(shù)。 |
單個(gè)節(jié)點(diǎn)內(nèi)存大小,單位M | 取值范圍為1024 MB~64*1024 MB。 |
【輸出樁說(shuō)明】
輸出樁(從左到右) | 存儲(chǔ)位置 | 下游建議組件 | 模型類(lèi)型 |
輸出結(jié)果 | 不需要配置 | 無(wú) | 無(wú) |
具體示例
您可以將以下代碼復(fù)制到PyAlink腳本組件中,使PyAlink腳本組件實(shí)現(xiàn)與該組件相同的功能。
from pyalink.alink import *
def main(sources, sinks, parameter):
data = sources[0]
op = ColumnsToVectorBatchOp()\
.setSelectedCols(["f0", "f1"])\
.setReservedCols(["row"])\
.setVectorCol("vec")\
.linkFrom(data)
result = op.linkFrom(data)
result.link(sinks[0])
BatchOperator.execute()