contingency_matrix#

sklearn.metrics.cluster.contingency_matrix(labels_true, labels_pred, *, eps=None, sparse=False, dtype=<class 'numpy.int64'>)[來源]#

建立一個描述標籤之間關係的列聯表。

參數:

labels_truearray-like of shape (n_samples,): 作為參考的真實類別標籤。
labels_predarray-like of shape (n_samples,): 要評估的群集標籤。
epsfloat, default=None: 如果為浮點數，則該值會加到列聯表中所有值。這有助於停止 NaN 的傳播。如果為 None，則不會進行調整。
sparsebool, default=False: 如果 True，則返回一個稀疏的 CSR 列聯矩陣。如果 eps 不是 None 且 sparse 為 True，則會引發 ValueError。

在 0.18 版本中新增。
dtype數值型別，預設值為 np.int64: 輸出資料型別。如果 eps 不是 None，則會被忽略。

在 0.24 版本中新增。

回傳值:

contingency{類陣列, 稀疏矩陣}, 形狀為 [n_classes_true, n_classes_pred]: 矩陣 \(C\)，使得 \(C_{i, j}\) 為真實類別 \(i\) 且預測類別 \(j\) 中的樣本數量。如果 eps is None，則此陣列的資料型別將為整數，除非使用 dtype 參數另行設定。如果給定 eps，則資料型別將為浮點數。如果 sparse=True，則會是 sklearn.sparse.csr_matrix。

範例

>>> from sklearn.metrics.cluster import contingency_matrix
>>> labels_true = [0, 0, 1, 1, 2, 2]
>>> labels_pred = [1, 0, 2, 1, 0, 2]
>>> contingency_matrix(labels_true, labels_pred)
array([[1, 1, 0],
       [0, 1, 1],
       [1, 0, 1]])