覆蓋率誤差#
- sklearn.metrics.coverage_error(y_true, y_score, *, sample_weight=None)[來源]#
覆蓋率誤差度量。
計算為了涵蓋所有真實標籤,需要瀏覽排序後分數多遠。最佳值等於
y_true
中每個樣本的平均標籤數量。y_scores
中的平局會被打破,方法是給予所有平局值可能被分配的最大排名。注意:我們的實作分數比 Tsoumakas 等人於 2010 年給出的分數大 1。這將其擴展以處理實例具有 0 個真實標籤的退化情況。
請在使用者指南中閱讀更多資訊。
- 參數:
- y_true形狀為 (n_samples, n_labels) 的類陣列
二元指示器格式的真實二元標籤。
- y_score形狀為 (n_samples, n_labels) 的類陣列
目標分數,可以是正類別的機率估計、置信度值或未閾值化的決策度量(由某些分類器的「decision_function」返回)。
- sample_weight形狀為 (n_samples,) 的類陣列,預設值=None
樣本權重。
- 回傳值:
- coverage_error浮點數
覆蓋率誤差。
參考文獻
[1]Tsoumakas, G., Katakis, I., & Vlahavas, I. (2010). Mining multi-label data. In Data mining and knowledge discovery handbook (pp. 667-685). Springer US.
範例
>>> from sklearn.metrics import coverage_error >>> y_true = [[1, 0, 0], [0, 1, 1]] >>> y_score = [[1, 0, 0], [0, 1, 1]] >>> coverage_error(y_true, y_score) np.float64(1.5)