完整性分數#
- sklearn.metrics.completeness_score(labels_true, labels_pred)[原始碼]#
計算給定真實標籤的叢集標記的完整性指標。
如果一個叢集結果滿足完整性,表示屬於給定類別的所有資料點都是同一個叢集的成員。
此指標與標籤的絕對值無關:類別或叢集標籤值的排列不會以任何方式改變分數值。
此指標不對稱:將
label_true
與label_pred
互換將會回傳homogeneity_score
,其結果通常會不同。更多資訊請參閱使用者指南。
- 參數:
- labels_truearray-like,形狀為 (n_samples,)
作為參考的真實類別標籤。
- labels_predarray-like,形狀為 (n_samples,)
要評估的叢集標籤。
- 回傳值:
- 完整性float
介於 0.0 和 1.0 之間的分數。1.0 代表完全完整的標記。
另請參閱
homogeneity_score
叢集標記的同質性指標。
v_measure_score
V-Measure(具有算術平均選項的 NMI)。
參考文獻
範例
完美的標記是完整的
>>> from sklearn.metrics.cluster import completeness_score >>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0]) np.float64(1.0)
將所有類別成員分配到相同叢集的不完美標記仍然是完整的
>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0])) 1.0 >>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1])) 0.999...
如果類別成員分散在不同的叢集中,則分配可能不完整
>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1])) 0.0 >>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3])) 0.0