sklearn.model_selection#

用於模型選擇的工具,例如交叉驗證和超參數調整。

使用者指南。 詳情請參閱交叉驗證:評估估計器效能調整估計器的超參數學習曲線等章節。

分割器#

GroupKFold

具有不重疊群組的 K 折疊迭代器變體。

GroupShuffleSplit

Shuffle-Group(s)-Out 交叉驗證迭代器。

KFold

K 折疊交叉驗證器。

LeaveOneGroupOut

Leave One Group Out 交叉驗證器。

LeaveOneOut

留一法交叉驗證器。

LeavePGroupsOut

Leave P Group(s) Out 交叉驗證器。

LeavePOut

留 P 法交叉驗證器。

PredefinedSplit

預定義分割交叉驗證器。

RepeatedKFold

重複 K 折疊交叉驗證器。

RepeatedStratifiedKFold

重複分層 K 折疊交叉驗證器。

ShuffleSplit

隨機排列交叉驗證器。

StratifiedGroupKFold

具有不重疊群組的分層 K 折疊迭代器變體。

StratifiedKFold

分層 K 折疊交叉驗證器。

StratifiedShuffleSplit

分層 ShuffleSplit 交叉驗證器。

TimeSeriesSplit

時間序列交叉驗證器。

check_cv

用於建立交叉驗證器的輸入檢查工具。

train_test_split

將陣列或矩陣分割為隨機的訓練和測試子集。

超參數最佳化器#

GridSearchCV

對估計器指定的參數值進行窮舉搜尋。

HalvingGridSearchCV

使用連續對分搜尋指定的參數值。

HalvingRandomSearchCV

對超參數進行隨機搜尋。

ParameterGrid

每個都有離散值的參數網格。

ParameterSampler

從給定分佈中取樣的參數產生器。

RandomizedSearchCV

對超參數進行隨機搜尋。

擬合後模型調整#

FixedThresholdClassifier

手動設定決策閾值的二元分類器。

TunedThresholdClassifierCV

使用交叉驗證後調整決策閾值的分類器。

模型驗證#

cross_val_predict

為每個輸入資料點產生交叉驗證的估計值。

cross_val_score

透過交叉驗證評估分數。

cross_validate

透過交叉驗證評估度量,並記錄擬合/評分時間。

learning_curve

學習曲線。

permutation_test_score

透過置換評估交叉驗證分數的顯著性。

validation_curve

驗證曲線。

視覺化#

LearningCurveDisplay

學習曲線視覺化。

ValidationCurveDisplay

驗證曲線視覺化。