覆蓋率誤差#

sklearn.metrics.coverage_error(y_true, y_score, *, sample_weight=None)[來源]#

覆蓋率誤差度量。

計算為了涵蓋所有真實標籤,需要瀏覽排序後分數多遠。最佳值等於 y_true 中每個樣本的平均標籤數量。

y_scores 中的平局會被打破,方法是給予所有平局值可能被分配的最大排名。

注意:我們的實作分數比 Tsoumakas 等人於 2010 年給出的分數大 1。這將其擴展以處理實例具有 0 個真實標籤的退化情況。

請在使用者指南中閱讀更多資訊。

參數:
y_true形狀為 (n_samples, n_labels) 的類陣列

二元指示器格式的真實二元標籤。

y_score形狀為 (n_samples, n_labels) 的類陣列

目標分數,可以是正類別的機率估計、置信度值或未閾值化的決策度量(由某些分類器的「decision_function」返回)。

sample_weight形狀為 (n_samples,) 的類陣列,預設值=None

樣本權重。

回傳值:
coverage_error浮點數

覆蓋率誤差。

參考文獻

[1]

Tsoumakas, G., Katakis, I., & Vlahavas, I. (2010). Mining multi-label data. In Data mining and knowledge discovery handbook (pp. 667-685). Springer US.

範例

>>> from sklearn.metrics import coverage_error
>>> y_true = [[1, 0, 0], [0, 1, 1]]
>>> y_score = [[1, 0, 0], [0, 1, 1]]
>>> coverage_error(y_true, y_score)
np.float64(1.5)