完整性分數#

sklearn.metrics.completeness_score(labels_true, labels_pred)[原始碼]#

計算給定真實標籤的叢集標記的完整性指標。

如果一個叢集結果滿足完整性,表示屬於給定類別的所有資料點都是同一個叢集的成員。

此指標與標籤的絕對值無關:類別或叢集標籤值的排列不會以任何方式改變分數值。

此指標不對稱:將label_truelabel_pred互換將會回傳homogeneity_score,其結果通常會不同。

更多資訊請參閱使用者指南

參數:
labels_truearray-like,形狀為 (n_samples,)

作為參考的真實類別標籤。

labels_predarray-like,形狀為 (n_samples,)

要評估的叢集標籤。

回傳值:
完整性float

介於 0.0 和 1.0 之間的分數。1.0 代表完全完整的標記。

另請參閱

homogeneity_score

叢集標記的同質性指標。

v_measure_score

V-Measure(具有算術平均選項的 NMI)。

參考文獻

範例

完美的標記是完整的

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
np.float64(1.0)

將所有類別成員分配到相同叢集的不完美標記仍然是完整的

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...

如果類別成員分散在不同的叢集中,則分配可能不完整

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0