覆蓋率誤差#

sklearn.metrics.coverage_error(y_true, y_score, *, sample_weight=None)[來源]#

覆蓋率誤差度量。

計算為了涵蓋所有真實標籤，需要瀏覽排序後分數多遠。最佳值等於 y_true 中每個樣本的平均標籤數量。

y_scores 中的平局會被打破，方法是給予所有平局值可能被分配的最大排名。

注意：我們的實作分數比 Tsoumakas 等人於 2010 年給出的分數大 1。這將其擴展以處理實例具有 0 個真實標籤的退化情況。

請在使用者指南中閱讀更多資訊。

參數:

y_true形狀為 (n_samples, n_labels) 的類陣列: 二元指示器格式的真實二元標籤。
y_score形狀為 (n_samples, n_labels) 的類陣列: 目標分數，可以是正類別的機率估計、置信度值或未閾值化的決策度量（由某些分類器的「decision_function」返回）。
sample_weight形狀為 (n_samples,) 的類陣列，預設值=None: 樣本權重。

回傳值:

coverage_error浮點數: 覆蓋率誤差。

參考文獻

[1]

Tsoumakas, G., Katakis, I., & Vlahavas, I. (2010). Mining multi-label data. In Data mining and knowledge discovery handbook (pp. 667-685). Springer US.

範例

>>> from sklearn.metrics import coverage_error
>>> y_true = [[1, 0, 0], [0, 1, 1]]
>>> y_score = [[1, 0, 0], [0, 1, 1]]
>>> coverage_error(y_true, y_score)
np.float64(1.5)