日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

LLM-敏感詞過濾(DLC)

LLM-敏感詞過濾(DLC)組件主要用于過濾掉帶有敏感詞的樣本。輸入的OSS數(shù)據(jù)文件(JSONL格式,示例)需符合:每一行是一個合法的JSON對象,文件由多行JSON對象組成,整個文件本身不是合法的JSON對象。

支持的計算資源

DLC

算法說明

識別文本中是否包含敏感詞,過濾掉包含敏感詞的樣本。支持返回文本中包含的敏感詞。默認提供的敏感詞數(shù)量共12000+,詳情請參見默認敏感詞

說明

如果默認敏感詞列表在線打開顯示亂碼,可嘗試下載到本地后再打開。

配置組件

在Designer工作流頁面添加LLM-敏感詞過濾(DLC)組件,并在界面右側配置相關參數(shù):

參數(shù)類型

參數(shù)

是否必選

描述

默認值

字段設置

目標處理字段

要處理的字段名稱。

數(shù)據(jù)輸出OSS目錄

處理后數(shù)據(jù)的OSS存儲目錄。如果為空,使用工作空間默認路徑。

敏感詞文件

敏感詞文件路徑。置空時,使用默認的敏感詞列表。文件格式為:"敏感詞1\n敏感詞2\n...",敏感詞之間用換行符分隔。

預置敏感詞文件

執(zhí)行調優(yōu)

多進程個數(shù)

設置進程數(shù)。

8

選擇資源組

公共資源組

選擇節(jié)點規(guī)格(CPU或GPU實例規(guī)格)、節(jié)點數(shù)量、專有網(wǎng)絡。

專有資源組

選擇CPU核數(shù)、內存、共享內存、GPU卡數(shù)、節(jié)點數(shù)量。

最大運行時長

組件最大運行時長,超過這個時間,作業(yè)會被kill。