d2_pinball_score#

sklearn.metrics.d2_pinball_score(y_true, y_pred, *, sample_weight=None, alpha=0.5, multioutput='uniform_average')[原始碼]#

\(D^2\) 回歸分數函數，解釋的 pinball 損失分數。

最佳可能分數為 1.0，且可能為負值（因為模型可能任意更差）。一個總是使用 y_true 的經驗 alpha 分位數作為常數預測，而忽略輸入特徵的模型，其 \(D^2\) 分數為 0.0。

請參閱使用者指南以了解更多資訊。

在 1.1 版本中新增。

參數:

y_truearray-like，形狀為 (n_samples,) 或 (n_samples, n_outputs)

真實（正確）目標值。

y_predarray-like，形狀為 (n_samples,) 或 (n_samples, n_outputs)

估計的目標值。

sample_weightarray-like，形狀為 (n_samples,)，預設值=None

樣本權重。

alphafloat，預設值=0.5

pinball 偏差的斜率。它決定 pinball 偏差和 D2 最佳化的分位數級別 alpha。預設值 alpha=0.5 等同於 d2_absolute_error_score。

multioutput{'raw_values', 'uniform_average'} 或 array-like，形狀為 (n_outputs,)，預設值='uniform_average'

定義多個輸出值的聚合方式。array-like 值定義用於平均分數的權重。

‘raw_values’: 在多輸出輸入的情況下，返回完整的錯誤集。
‘uniform_average’: 所有輸出的分數以均勻權重平均。

返回:

scorefloat 或浮點數的 ndarray: 帶有 pinball 偏差的 \(D^2\) 分數，或者如果 multioutput='raw_values' 則為分數的 ndarray。

注意事項

與 \(R^2\) 類似，\(D^2\) 分數可能為負值（它實際上不一定是量 D 的平方）。

此度量對於單個點來說沒有明確定義，如果 n_samples 小於 2，將返回 NaN 值。

參考文獻

[1]

Koenker, Roger; Machado, José A. F. (1999)。“Goodness of Fit and Related Inference Processes for Quantile Regression” 的方程式 (7)

[2]

Hastie, Trevor J., Robert Tibshirani 和 Martin J. Wainwright 的 “Statistical Learning with Sparsity: The Lasso and Generalizations.” (2015) 的方程式 (3.11)。https://hastie.su.domains/StatLearnSparsity/

範例

>>> from sklearn.metrics import d2_pinball_score
>>> y_true = [1, 2, 3]
>>> y_pred = [1, 3, 3]
>>> d2_pinball_score(y_true, y_pred)
np.float64(0.5)
>>> d2_pinball_score(y_true, y_pred, alpha=0.9)
np.float64(0.772...)
>>> d2_pinball_score(y_true, y_pred, alpha=0.1)
np.float64(-1.045...)
>>> d2_pinball_score(y_true, y_true, alpha=0.1)
np.float64(1.0)