成對混淆矩陣#

sklearn.metrics.cluster.pair_confusion_matrix(labels_true, labels_pred)[來源]#

由兩個叢集產生的成對混淆矩陣。

成對混淆矩陣 \(C\) 通過考慮所有樣本對，並計算在真實和預測叢集中被分配到相同或不同叢集的樣本對，來計算兩個叢集之間的 2x2 相似度矩陣 [1]。

考慮一對被叢集在一起的樣本為正樣本對，那麼與二元分類相同，真負例計數為 \(C_{00}\)，偽負例為 \(C_{10}\)，真陽例為 \(C_{11}\)，而偽陽例為 \(C_{01}\)。

詳情請參閱使用者指南。

參數:

回傳值:

另請參閱

參考文獻

[1]

範例

完全匹配的標記在對角線上都有非零條目，而不管實際標籤值如何

>>> from sklearn.metrics.cluster import pair_confusion_matrix
>>> pair_confusion_matrix([0, 0, 1, 1], [1, 1, 0, 0])
array([[8, 0],
       [0, 4]]...

將所有類別成員分配到相同叢集的標記是完整的，但可能並不總是純粹的，因此會受到懲罰，並且具有一些非對角的非零條目

>>> pair_confusion_matrix([0, 0, 1, 2], [0, 0, 1, 1])
array([[8, 2],
       [0, 2]]...

請注意，矩陣不是對稱的。