contingency_matrix#
- sklearn.metrics.cluster.contingency_matrix(labels_true, labels_pred, *, eps=None, sparse=False, dtype=<class 'numpy.int64'>)[來源]#
建立一個描述標籤之間關係的列聯表。
- 參數:
- labels_truearray-like of shape (n_samples,)
作為參考的真實類別標籤。
- labels_predarray-like of shape (n_samples,)
要評估的群集標籤。
- epsfloat, default=None
如果為浮點數,則該值會加到列聯表中所有值。這有助於停止 NaN 的傳播。如果為
None
,則不會進行調整。- sparsebool, default=False
如果
True
,則返回一個稀疏的 CSR 列聯矩陣。如果eps
不是None
且sparse
為True
,則會引發 ValueError。在 0.18 版本中新增。
- dtype數值型別,預設值為 np.int64
輸出資料型別。如果
eps
不是None
,則會被忽略。在 0.24 版本中新增。
- 回傳值:
- contingency{類陣列, 稀疏矩陣}, 形狀為 [n_classes_true, n_classes_pred]
矩陣 \(C\),使得 \(C_{i, j}\) 為真實類別 \(i\) 且預測類別 \(j\) 中的樣本數量。如果
eps is None
,則此陣列的資料型別將為整數,除非使用dtype
參數另行設定。如果給定eps
,則資料型別將為浮點數。如果sparse=True
,則會是sklearn.sparse.csr_matrix
。
範例
>>> from sklearn.metrics.cluster import contingency_matrix >>> labels_true = [0, 0, 1, 1, 2, 2] >>> labels_pred = [1, 0, 2, 1, 0, 2] >>> contingency_matrix(labels_true, labels_pred) array([[1, 1, 0], [0, 1, 1], [1, 0, 1]])