蘭德分數#
- sklearn.metrics.rand_score(labels_true, labels_pred)[原始碼]#
蘭德索引。
蘭德索引透過考慮所有樣本對,並計算在預測和真實分群中被分配到相同或不同群集的樣本對,來計算兩個分群之間的相似性度量[1] [2]。
原始 RI 分數[3] 是
RI = (number of agreeing pairs) / (number of pairs)
在 使用者指南 中閱讀更多內容。
- 參數:
- labels_true形狀為 (n_samples,) 的類陣列,dtype=integral
要作為參考的真實類別標籤。
- labels_pred形狀為 (n_samples,) 的類陣列,dtype=integral
要評估的分群標籤。
- 傳回值:
- RI浮點數
介於 0.0 和 1.0 之間的相似性分數,包含兩者,1.0 表示完全匹配。
另請參閱
調整後蘭德分數 (adjusted_rand_score)
調整後的蘭德分數。
調整後互信息分數 (adjusted_mutual_info_score)
調整後的互信息。
參考文獻
範例
即使標籤完全匹配,分數也為 1
>>> from sklearn.metrics.cluster import rand_score >>> rand_score([0, 0, 1, 1], [1, 1, 0, 0]) 1.0
將所有類別成員分配到相同群集的標籤是完整的,但可能不總是純粹的,因此會受到懲罰
>>> rand_score([0, 0, 1, 2], [0, 0, 1, 1]) np.float64(0.83...)