亚洲春色古典小说自拍,亚洲аv天堂无码,五月丁香啪啪综合缴情

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）是一種基于密度的聚類算法。它將簇定義為密度相連的點的最大集合，把具有足夠高密度的區域劃分為簇，可以在噪聲的空間數據集中發現任意形狀的聚類。您可以使用DBSCAN組件構建聚類模型。本文為您介紹DBSCAN組件的配置方法。

功能限制

僅支持在Designer上使用。
支持的計算引擎為MaxCompute和Flink。

可視化配置組件參數

Designer支持通過可視化的方式，配置組件參數。

頁簽	參數	描述
字段設置	ID列名	ID列對應的列名。
字段設置	向量列名	向量列對應的列名。
參數設置	鄰域距離閾值	如果節點A是節點B的鄰域，則節點A和節點B之間的距離不超過該閾值。具體配置方法，詳情請參見附錄2：如何配置參數。
	鄰域中樣本個數的閾值	當一個節點被認為是核心（core）時，它的鄰域中至少包含的節點個數。具體配置方法，詳情請參見附錄2：如何配置參數。
	預測結果列名	預測結果列的名稱。
	距離度量方式	聚類使用的距離類型，默認為EUCLIDEAN，取值如下： EUCLIDEAN：歐式距離。公式為：。 COSINE：夾角余弦距離，公式為：。 CITYBLOCK：街區距離，公式為：。
執行調優	節點個數	與單個節點內存大小參數配對使用。取值為[1, 9999]的正整數。具體配置方法，詳情請參見附錄1：如何預估資源使用量。
執行調優	單個節點內存大小，單位M	取值范圍為1024 MB~64*1024 MB。具體配置方法，詳情請參見附錄1：如何預估資源使用量。

附錄1：如何預估資源使用量

您可以參考以下內容，來預估資源的使用量。

如何預估每個節點的內存大小？
將輸入數據的大小乘以15，即為每個節點的內存大小。
例如：輸入數據的大小為1 GB，則每個節點的內存大小可以配置為15 GB。
如何預估節點的個數？
由于存在通信開銷，隨著節點數量的增加，分布式訓練任務速度會先變快，后變慢。如果您觀測到訓練任務隨著節點數量增加之后，速度變慢，則應該停止增加節點數量。
該算法可以支持多大的數據量？
數據量小于100萬條，維度小于200。
說明
如果數據量超出范圍，建議先將數據分組，每個分組分別跑DBSCAN算法。
一個中心點的聚類中心ID為什么是2147483648？
因為該數據點為離散點，不屬于任何一個聚類中心。

附錄2：如何配置參數

DBSCAN組件常用的兩個參數為：鄰域中樣本個數閾值（minPoints）和鄰域距離閾值（epsilon），具體配置方法如下：

當觀測到簇數目過多，想要減少簇數目時，建議優先調大minPoints，再調小epsilon。
當觀測到簇數目過少，想要增加簇數目時，建議優先調小minPoints，再調大epsilon。

日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

功能限制

可視化配置組件參數

附錄1：如何預估資源使用量

附錄2：如何配置參數