日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

在機(jī)器學(xué)習(xí)的分類問題中,IV值(Information Value)主要用于對輸入特征變量進(jìn)行編碼,同時評估特征變量的預(yù)測能力。特征變量IV值的大小即表示該特征變量預(yù)測能力的強(qiáng)弱。本文介紹了IV算法相關(guān)的內(nèi)容。

使用場景

IV值一般用于在風(fēng)控場景中篩選變量。例如,在風(fēng)控場景中可能會有千級別、萬級別的特征,人工很難發(fā)現(xiàn)有效特征,通過計算IV值,可以將有效的特征篩選出來,從而針對性地收集和處理。

語法

CREATE FEATURE feature_name WITH ( feature_class = '', x_cols = '', y_cols = '', parameters=()) AS (SELECT select_expr [, select_expr] ... FROM table_reference)

語法中對應(yīng)的參數(shù)說明如下:

參數(shù)

說明

feature_name

特征名稱。

feature_class

特征的類型。固定值iv。

x_cols

自變量列表,多個自變量之間使用英文逗號(,)分隔。

y_cols

因變量。

parameters

創(chuàng)建特征時用戶自定義的參數(shù)。目前僅支持配置為categorical_feature,表示類目型的特征,多個特征之間使用英文逗號(,)分隔,不參與計算。

select_expr

用于創(chuàng)建特征的列名。

table_reference

用于創(chuàng)建特征的列所在的表的名稱。

示例

/*polar4ai*/CREATE FEATURE iv_001 WITH ( feature_class = 'iv',x_cols='Airline,Flight,AirportFrom,AirportTo,DayOfWeek,Time,Length',y_cols='Delay',parameters=(categorical_feature='Airline,Flight,AirportFrom,AirportTo,DayOfWeek')) AS (SELECT * from airlines_test_1000);