d2_tweedie_score#

sklearn.metrics.d2_tweedie_score(y_true, y_pred, *, sample_weight=None, power=0)[原始碼]#

\(D^2\) 回歸評分函數,表示 Tweedie 偏差被解釋的比例。

最佳分數為 1.0,且可能為負值(因為模型可能任意更差)。一個總是使用 y_true 的經驗平均值作為常數預測的模型,忽略輸入特徵,其 D^2 分數為 0.0。

請在使用者指南中閱讀更多內容。

在 1.0 版本中新增。

參數:
y_true類陣列,形狀為 (n_samples,)

真實(正確)的目標值。

y_pred類陣列,形狀為 (n_samples,)

預估的目標值。

sample_weight類陣列,形狀為 (n_samples,),預設值為 None

樣本權重。

power浮點數,預設值為 0

Tweedie 冪參數。必須滿足 power <= 0 或 power >= 1。

p 的值越高,真實值和預測目標值之間的極端偏差所佔的權重就越低。

  • power < 0:極端穩定分佈。要求:y_pred > 0。

  • power = 0:常態分佈,輸出對應於 r2_score。y_true 和 y_pred 可以是任何實數。

  • power = 1:Poisson 分佈。要求:y_true >= 0 且 y_pred > 0。

  • 1 < p < 2:複合 Poisson 分佈。要求:y_true >= 0 且 y_pred > 0。

  • power = 2:Gamma 分佈。要求:y_true > 0 且 y_pred > 0。

  • power = 3:反高斯分佈。要求:y_true > 0 且 y_pred > 0。

  • 其他情況:正穩定分佈。要求:y_true > 0 且 y_pred > 0。

返回:
z浮點數或浮點數的 ndarray

D^2 分數。

註解

這不是一個對稱函數。

與 R^2 類似,D^2 分數可能為負值(它實際上不必是數量 D 的平方)。

此指標對於單個樣本沒有明確定義,如果 n_samples 小於 2,則會返回 NaN 值。

參考文獻

[1]

Hastie, Trevor J., Robert Tibshirani 和 Martin J. Wainwright 的著作“Statistical Learning with Sparsity: The Lasso and Generalizations”中的公式(3.11)。(2015)。https://hastie.su.domains/StatLearnSparsity/

範例

>>> from sklearn.metrics import d2_tweedie_score
>>> y_true = [0.5, 1, 2.5, 7]
>>> y_pred = [1, 1, 5, 3.5]
>>> d2_tweedie_score(y_true, y_pred)
0.285...
>>> d2_tweedie_score(y_true, y_pred, power=1)
0.487...
>>> d2_tweedie_score(y_true, y_pred, power=2)
0.630...
>>> d2_tweedie_score(y_true, y_true, power=2)
1.0