蘭德分數#

sklearn.metrics.rand_score(labels_true, labels_pred)[原始碼]#

蘭德索引。

蘭德索引透過考慮所有樣本對,並計算在預測和真實分群中被分配到相同或不同群集的樣本對,來計算兩個分群之間的相似性度量[1] [2]

原始 RI 分數[3]

RI = (number of agreeing pairs) / (number of pairs)

使用者指南 中閱讀更多內容。

參數:
labels_true形狀為 (n_samples,) 的類陣列,dtype=integral

要作為參考的真實類別標籤。

labels_pred形狀為 (n_samples,) 的類陣列,dtype=integral

要評估的分群標籤。

傳回值:
RI浮點數

介於 0.0 和 1.0 之間的相似性分數,包含兩者,1.0 表示完全匹配。

另請參閱

調整後蘭德分數 (adjusted_rand_score)

調整後的蘭德分數。

調整後互信息分數 (adjusted_mutual_info_score)

調整後的互信息。

參考文獻

範例

即使標籤完全匹配,分數也為 1

>>> from sklearn.metrics.cluster import rand_score
>>> rand_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

將所有類別成員分配到相同群集的標籤是完整的,但可能不總是純粹的,因此會受到懲罰

>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1])
np.float64(0.83...)