下表是電商場景建議要有的用戶表、物品表、行為表的字段,字段越完善越豐富,推薦效果會越好。 如能提供下表中沒有涵蓋到的特征字段,可以在后面追加字段,多多益善。不要求字段名稱與下面表格中的字段名稱完全一致。
用戶表
系統內全部注冊用戶表,建議每天一個分區,每個分區為當天全量用戶的快照。
字段名 | 字段含義 | 是否必填 | 字段值說明 |
user_id | 用戶唯一ID | 已登錄用戶必填 | user_id 可作為一個用戶的唯一標識 |
user_id_type | 用戶注冊類型 | 可選 |
|
imei | 設備ID? | 未登錄用戶必填 | imei |
gender | 性別 | 可選 | male/female/unknown |
age / birthday | 年齡 / 出生日期 | 可選 | |
purchasing | 購買力 | 可選 | 基于歷史數據統計/建模得到 |
country | 國家 | 可選 | |
province | 省份 | 可選 | |
city | 城市 | 可選 | |
register_time | 注冊時間戳 | 可選 | 單位:秒 |
education | 用戶學歷 | 可選 | |
career | 用戶職業 | 可選 | |
last_login_time | 上次登錄時間戳 | 可選 | 單位:秒,例:1520017038 |
source | 用戶來源 | 可選 | 頭條、微信 |
content | 用戶描述 | 可選 | |
tags | 對用戶的標簽描述 | 可選 | 足球、健身、戶外 |
商品表
系統內全量商品表。建議每天一個分區,每個分區為截止當天全量內容的快照。
字段名 | 字段含義 | 是否必填 | 字段值說明 |
item_id | 商品唯一Id | 必填 | |
item_type | 商品類型 | 可選 | ? |
source_id | 商品來源 | 可選 | 導購電商填寫商品的源平臺,如淘寶、天貓、京東等 |
title | 商品標題 | 建議填寫 | 將用于語義層面深入分析,置空會損失部分算法效果 |
sub_title | 商品副標題 | 可選 | |
pub_time | 發布時的時間戳 | 必填 | 單位:秒 |
expire_time | 內容失效時間戳 | 可選 | 單位:秒 |
category_level | 類目層級數 | 建議填寫 | 例如3級類目 |
cate_id_path | 全類目id路徑 | 建議填寫 | 支持多級類目,用下劃線聯接 |
cate_name_path | 全類目名稱路徑 | 建議填寫 | 支持多級類目,用下劃線聯接 |
cate1_id | 一級類目id | 建議填寫 | 類目層級樹需遵循“MECE”原則 |
cate2_id | 二級類目id | 建議填寫 | 類目層級樹需要“完全窮盡、相互獨立”,語義上不可交叉 |
cate_id | 葉子類目id | 建議填寫 | 類目層級樹的末級葉子節點ID |
cate1_name | 一級類目名稱 | 建議填寫 | |
cate2_name | 二級類目名稱 | 建議填寫 | |
cate_name | 葉子類目名稱 | 建議填寫 | |
brand_id | 品牌ID | 建議填寫 | 品牌ID |
shop_id | 店鋪ID | 可選 | 店鋪ID |
description | 商品詳情描述 | 可選 | |
price | 商品價格 | 必填 | float類型,實際售賣價格 |
origin_price | 商品原價 | 可選 | 折扣前的售價 |
discount | 折扣 | 可選 | price/origin_price |
tags | 商品標簽 | 可選 | 業務運營打上的標簽,例如參加活動的ID |
color | 顏色分類 | 可選 | |
properties | 商品屬性名&屬性值 | 建議填寫 | 指商家填寫的商品參數 json格式,例如:{"material": "棉", "style": "通勤"} |
postage | 運費 | 可選 | 包郵商品運費填0 |
image_url | 商品圖片url | 可選 | 提供公網可下載的鏈接 |
video_url | 商品視頻url | 可選 | 提供公網可下載的鏈接 |
shop_dsr | 商家動態評分 | 可選 | 店鋪評分,也稱:DSR動態評分(Detailed seller ratings),評分:寶貝與描述相符、賣家的服務態度、物流服務的質量 |
spu_id | spu_id | 建議填寫 | 標準產品單位ID |
sku_id | sku_id | 可選 | 最小貨存單位ID |
prov | 商品所在省份 | 可選 | |
city | 商品所在城市 | 可選 | |
rate | 好評率 | 可選 |
行為表
最近一段時間App的行為數據 或 場景內的行為數據,建議至少30-60天。
字段名 | 字段含義 | 是否必填 | 字段值說明 |
user_id | 用戶ID | 已登錄用戶必填 | |
imei | 用戶設備ID | 未登錄用戶必填 | imei |
item_id | 商品ID | 必填 | |
item_type | 商品類型 | 可選 | |
event | 行為類型 | 必填 | 曝光、停留、點擊、收藏、下載、購買、加購、評價等 |
event_time | 行為時間戳 | 必填 | 單位:秒 |
event_value | 行為值 | 可選 | 停留時長,購買件數、購買金額等 |
request_id | 請求追蹤/埋點ID | 建議填寫 | 每次推薦請求的唯一ID |
exp_id | 實驗桶ID | 建議填寫 | |
request_info | 請求埋點信息 | 可選 | 推薦接口調用時返回該信息,日志記錄時帶上即可 |
scene | 場景ID | 可選 | |
page | 頁面ID | 可選 | 商品詳情頁填寫主商品ID |
source_page | 上一頁面 | 可選 | |
position | 內容所在的位置信息 | 必填 | 在列表中的第幾個位置 |
app_version | app的版本號 | 可選 | |
net_type | 網絡型號 | 可選 | 3G/4G/5G/WIFI |
ip | 客戶端IP信息 | 可選 | 輔助定位用戶地理位置 |
login | 是否登錄用戶 | 必填 | |
device_platform | 客戶端平臺 | 必填 | ios/android/h5/msite |
device_system | 設備操作系統 | 建議填寫 | ios、android、pc |
device_model | 設備型號 | 可選 | iphoneX |
device_brand | 設備品牌/制造商 | 可選 | 小米、華為等 |
longitude | 位置經度 | 可選 | |
latitude | 位置緯度 | 可選 | |
country | 國家 | 可選 | |
province | 省份 | 可選 | |
city | 城市 | 建議填寫 |
行為類型
下表為電商行業支持的9種常見行為類型。
序號 | 行為釋義 | event | event_value | 說明 |
1 | 曝光 | expose | 置空即可 | / |
2 | 點擊 | click | 置空即可 | / |
3 | 點贊 | like | 置空即可 | / |
4 | 踩 | unlike | 置空即可 | / |
5 | 評論 | comment | 評論內容 | 可用來挖掘用戶的購物體驗和商品質量 |
6 | 收藏 | collect | 置空即可 | / |
7 | 停留時長 | stay | 時長 | 單位不限,請注意每條數據中具備相同單位約定 |
8 | 加購 | cart | 件數,單價((英文逗號隔開)示例:1,10000 | 單價:RMB,可精確到百分位(分) |
9 | 購買 | buy | 件數,單價(英文逗號隔開)示例:1,10000 | 單價:RMB,可精確到百分位(分)。一條購買行為中,只能對應一個item_id,一個訂單多個item_id,需要進行拆分。 |
10 | 評價 | evaluate | 離散的遞增或遞減的整數 | 舉例:若使用星級評價,1-5星表示好評度遞增,則可設置對應關系為1星值取1,2星2,5星5。務必保證增減邏輯與實際好差評趨勢對應。 |
11 | 負反饋 | dislike |