API Reference#

這是 scikit-learn 的類別和函式參考。請參閱完整使用者指南以取得更多詳細資訊,因為類別和函式的原始規格可能不足以提供其使用上的完整指南。如需關於 API 中重複出現的概念的參考,請參閱常用詞彙和 API 元素的詞彙表

物件

描述

config_context

用於全域 scikit-learn 設定的上下文管理器。

get_config

檢索由 set_config 設定的目前配置值。

set_config

設定全域 scikit-learn 配置。

show_versions

印出有用的除錯資訊

BaseEstimator

scikit-learn 中所有估計器的基底類別。

BiclusterMixin

scikit-learn 中所有雙聚類估計器的混合類別。

ClassNamePrefixFeaturesOutMixin

透過前綴產生自身名稱的轉換器的混合類別。

ClassifierMixin

scikit-learn 中所有分類器的混合類別。

ClusterMixin

scikit-learn 中所有叢集估計器的混合類別。

DensityMixin

scikit-learn 中所有密度估計器的混合類別。

MetaEstimatorMixin

scikit-learn 中所有元估計器的混合類別。

OneToOneFeatureMixin

為簡單轉換器提供 get_feature_names_out

OutlierMixin

scikit-learn 中所有離群值偵測估計器的混合類別。

RegressorMixin

scikit-learn 中所有迴歸估計器的混合類別。

TransformerMixin

scikit-learn 中所有轉換器的混合類別。

clone

使用相同的參數建構一個新的未擬合的估計器。

is_classifier

如果給定的估計器(可能)是分類器,則返回 True。

is_clusterer

如果給定的估計器(可能)是分群器,則返回 True。

is_regressor

如果給定的估計器(可能)是迴歸器,則返回 True。

is_outlier_detector

如果給定的估計器(可能)是離群值偵測器,則返回 True。

CalibratedClassifierCV

使用等張迴歸或邏輯迴歸進行機率校準。

calibration_curve

計算校準曲線的真實和預測機率。

CalibrationDisplay

校準曲線(也稱為可靠性圖)視覺化。

AffinityPropagation

對資料執行親和力傳播分群。

AgglomerativeClustering

聚合分群。

Birch

實作 BIRCH 分群演算法。

BisectingKMeans

二分 K-Means 分群。

DBSCAN

從向量陣列或距離矩陣執行 DBSCAN 分群。

FeatureAgglomeration

聚合特徵。

HDBSCAN

使用基於階層密度的分群來分群資料。

KMeans

K-Means 分群。

MeanShift

使用平坦核心進行均值漂移分群。

MiniBatchKMeans

Mini-Batch K-Means 分群。

OPTICS

從向量陣列估計分群結構。

SpectralBiclustering

頻譜雙分群(Kluger, 2003)。

SpectralClustering

將分群應用於正規化拉普拉斯算子的投影。

SpectralCoclustering

頻譜共分群演算法(Dhillon, 2001)。

affinity_propagation

對資料執行親和力傳播分群。

cluster_optics_dbscan

對任意 epsilon 執行 DBSCAN 提取。

cluster_optics_xi

根據 Xi 陡峭法自動提取叢集。

compute_optics_graph

計算 OPTICS 可達性圖。

dbscan

從向量陣列或距離矩陣執行 DBSCAN 分群。

estimate_bandwidth

估計與均值漂移演算法一起使用的頻寬。

k_means

執行 K-means 分群演算法。

kmeans_plusplus

根據 k-means++ 初始化 n_clusters 個種子。

mean_shift

使用平坦核心對資料執行均值漂移分群。

spectral_clustering

將分群應用於正規化拉普拉斯算子的投影。

ward_tree

基於特徵矩陣的 Ward 分群。

ColumnTransformer

將轉換器應用於陣列或 pandas DataFrame 的列。

TransformedTargetRegressor

對轉換後的目標進行迴歸的元估計器。

make_column_selector

建立一個可呼叫的物件,用於選擇要使用的列

make_column_transformer

從給定的轉換器建構 ColumnTransformer。

EllipticEnvelope

用於偵測高斯分佈資料集中離群值的物件。

EmpiricalCovariance

最大概似共變異數估計器。

GraphicalLasso

具有 l1 懲罰估計器的稀疏逆共變異數估計。

GraphicalLassoCV

使用交叉驗證選擇 l1 懲罰的稀疏逆共變異數。

LedoitWolf

LedoitWolf 估計器。

MinCovDet

最小共變異數行列式 (MCD):共變異數的穩健估計器。

OAS

神諭近似收縮估計器。

ShrunkCovariance

具有收縮的共變異數估計器。

empirical_covariance

計算最大概似共變異數估計器。

graphical_lasso

L1 懲罰的共變異數估計器。

ledoit_wolf

估計收縮的 Ledoit-Wolf 共變異數矩陣。

ledoit_wolf_shrinkage

估計收縮的 Ledoit-Wolf 共變異數矩陣。

oas

使用神諭近似收縮來估計共變異數。

shrunk_covariance

計算對角線收縮的共變異數矩陣。

CCA

典型相關分析,也稱為「模式 B」PLS。

PLSCanonical

偏最小平方轉換器和迴歸器。

PLSRegression

PLSSVD

偏最小平方 SVD。

clear_data_home

刪除資料主目錄快取中的所有內容。

dump_svmlight_file

以 svmlight / libsvm 檔案格式轉儲資料集。

fetch_20newsgroups

從 20 個新聞群組資料集(分類)載入檔案名稱和資料。

fetch_20newsgroups_vectorized

載入並向量化 20 個新聞群組資料集(分類)。

fetch_california_housing

載入加州房屋資料集(迴歸)。

fetch_covtype

載入 covertype 資料集(分類)。

fetch_file

如果本機資料夾中尚不存在,則從網路上取得檔案。

fetch_kddcup99

載入 kddcup99 資料集(分類)。

fetch_lfw_pairs

載入野外標記人臉 (LFW) 配對資料集(分類)。

fetch_lfw_people

載入野外標記人臉 (LFW) 人員資料集(分類)。

fetch_olivetti_faces

從 AT&T 載入 Olivetti 人臉資料集(分類)。

fetch_openml

按名稱或資料集 ID 從 openml 取得資料集。

fetch_rcv1

載入 RCV1 多標籤資料集(分類)。

fetch_species_distributions

從 Phillips 等人(2006 年)載入物種分佈資料集。

get_data_home

返回 scikit-learn 資料目錄的路徑。

load_breast_cancer

載入並返回乳癌威斯康辛資料集(分類)。

load_diabetes

載入並返回糖尿病資料集(迴歸)。

load_digits

載入並返回數字資料集(分類)。

load_files

載入以類別作為子資料夾名稱的文字檔。

load_iris

載入並返回鳶尾花資料集(分類)。

load_linnerud

載入並返回體能運動 Linnerud 資料集。

load_sample_image

載入單一範例影像的 numpy 陣列。

load_sample_images

載入用於影像處理的範例影像。

load_svmlight_file

以 svmlight / libsvm 格式將資料集載入到稀疏 CSR 矩陣中。

load_svmlight_files

從 SVMlight 格式的多個檔案載入資料集。

load_wine

載入並返回葡萄酒資料集(分類)。

make_biclusters

產生用於雙分群的常數區塊對角結構陣列。

make_blobs

產生用於分群的同向高斯 blob。

make_checkerboard

產生用於雙分群的具有區塊棋盤結構的陣列。

make_circles

在 2d 中製作一個包含較小圓圈的大圓圈。

make_classification

產生一個隨機的 n 類分類問題。

make_friedman1

產生「Friedman #1」迴歸問題。

make_friedman2

產生「Friedman #2」迴歸問題。

make_friedman3

產生「Friedman #3」迴歸問題。

make_gaussian_quantiles

產生同向高斯和按分位數標記樣本。

make_hastie_10_2

產生用於 Hastie 等人 2009 年範例 10.2 中使用的二元分類資料。

make_low_rank_matrix

產生一個具有鐘形奇異值的低階矩陣。

make_moons

製作兩個交錯的半圓。

make_multilabel_classification

產生一個隨機的多標籤分類問題。

make_regression

產生一個隨機的迴歸問題。

make_s_curve

產生一個 S 曲線資料集。

make_sparse_coded_signal

產生一個信號作為字典元素的稀疏組合。

make_sparse_spd_matrix

產生一個稀疏對稱正定矩陣。

make_sparse_uncorrelated

產生一個具有稀疏不相關設計的隨機迴歸問題。

make_spd_matrix

產生一個隨機的對稱正定矩陣。

make_swiss_roll

產生一個瑞士捲資料集。

DictionaryLearning

字典學習。

FactorAnalysis

因子分析 (FA)。

FastICA

FastICA:用於獨立成分分析的快速演算法。

IncrementalPCA

增量主成分分析 (IPCA)。

KernelPCA

核心主成分分析 (KPCA)。

LatentDirichletAllocation

具有線上變分貝氏演算法的潛在狄利克雷分配。

MiniBatchDictionaryLearning

Mini-batch 字典學習。

MiniBatchNMF

Mini-Batch 非負矩陣分解 (NMF)。

MiniBatchSparsePCA

Mini-batch 稀疏主成分分析。

NMF

非負矩陣分解 (NMF)。

PCA

主成分分析 (PCA)。

SparseCoder

稀疏編碼。

SparsePCA

稀疏主成分分析 (SparsePCA)。

TruncatedSVD

使用截斷 SVD(又稱 LSA)進行降維。

dict_learning

解決字典學習矩陣分解問題。

dict_learning_online

線上解決字典學習矩陣分解問題。

fastica

執行快速獨立成分分析。

non_negative_factorization

計算非負矩陣分解 (NMF)。

sparse_encode

稀疏編碼。

LinearDiscriminantAnalysis

線性判別分析。

QuadraticDiscriminantAnalysis

二次判別分析。

DummyClassifier

DummyClassifier 進行忽略輸入特徵的預測。

DummyRegressor

使用簡單規則進行預測的迴歸器。

AdaBoostClassifier

AdaBoost 分類器。

AdaBoostRegressor

AdaBoost 迴歸器。

BaggingClassifier

Bagging 分類器。

BaggingRegressor

Bagging 迴歸器。

ExtraTreesClassifier

額外樹狀分類器。

ExtraTreesRegressor

額外樹狀迴歸器。

GradientBoostingClassifier

用於分類的梯度提升。

GradientBoostingRegressor

用於迴歸的梯度提升。

HistGradientBoostingClassifier

基於長條圖的梯度提升分類樹。

HistGradientBoostingRegressor

基於長條圖的梯度提升迴歸樹。

IsolationForest

隔離森林演算法。

RandomForestClassifier

隨機森林分類器。

RandomForestRegressor

隨機森林迴歸器。

RandomTreesEmbedding

完全隨機樹的集成。

StackingClassifier

堆疊多個估計器,並以最終分類器作結。

StackingRegressor

堆疊多個估計器,並以最終迴歸器作結。

VotingClassifier

用於未擬合估計器的軟投票/多數決分類器。

VotingRegressor

用於未擬合估計器的預測投票迴歸器。

ConvergenceWarning

用於捕捉收斂問題的自訂警告。

DataConversionWarning

用於通知程式碼中發生的隱式資料轉換的警告。

DataDimensionalityWarning

用於通知資料維度潛在問題的自訂警告。

EfficiencyWarning

用於通知使用者計算效率不佳的警告。

FitFailedWarning

如果在擬合估計器時發生錯誤,則使用的警告類別。

InconsistentVersionWarning

當估計器以不一致的版本還原序列化時發出的警告。

NotFittedError

如果估計器在擬合前被使用,則引發的例外類別。

UndefinedMetricWarning

當度量無效時使用的警告。

EstimatorCheckFailedWarning

當來自常見測試的估計器檢查失敗時發出的警告。

enable_halving_search_cv

啟用連續減半搜尋估計器。

enable_iterative_imputer

啟用 IterativeImputer。

DictVectorizer

將特徵值映射列表轉換為向量。

FeatureHasher

實作特徵雜湊,又稱雜湊技巧。

PatchExtractor

從影像集合中提取圖塊。

extract_patches_2d

將 2D 影像重新塑形為圖塊集合。

grid_to_graph

像素到像素連接的圖形。

img_to_graph

像素到像素梯度連接的圖形。

reconstruct_from_patches_2d

從所有圖塊重建影像。

CountVectorizer

將文字文件集合轉換為詞符計數矩陣。

HashingVectorizer

將文字文件集合轉換為詞符出現次數矩陣。

TfidfTransformer

將計數矩陣轉換為標準化的 tf 或 tf-idf 表示法。

TfidfVectorizer

將原始文件集合轉換為 TF-IDF 特徵矩陣。

GenericUnivariateSelect

具有可設定策略的單變數特徵選擇器。

RFE

使用遞迴特徵消除進行特徵排名。

RFECV

使用交叉驗證進行遞迴特徵消除以選擇特徵。

SelectFdr

篩選器:選取估計偽發現率的 p 值。

SelectFpr

篩選器:根據 FPR 測試選取低於 alpha 的 p 值。

SelectFromModel

用於根據重要性權重選取特徵的中繼轉換器。

SelectFwe

篩選器:選取對應於 Family-wise 錯誤率的 p 值。

SelectKBest

根據 k 個最高分數選取特徵。

SelectPercentile

根據最高分數的百分位數選取特徵。

SelectorMixin

執行特徵選擇(給定支援遮罩)的轉換器混合。

SequentialFeatureSelector

執行序列特徵選擇的轉換器。

VarianceThreshold

移除所有低變異數特徵的特徵選擇器。

chi2

計算每個非負特徵和類別之間的卡方統計量。

f_classif

計算提供樣本的 ANOVA F 值。

f_regression

傳回 F 統計量和 p 值的單變數線性迴歸測試。

mutual_info_classif

估計離散目標變數的互資訊。

mutual_info_regression

估計連續目標變數的互資訊。

r_regression

計算每個特徵和目標的皮爾森 r 值。

FrozenEstimator

包裝擬合估計器以防止重新擬合的估計器。

GaussianProcessClassifier

基於 Laplace 近似的 Gaussian process 分類 (GPC)。

GaussianProcessRegressor

Gaussian process 迴歸 (GPR)。

CompoundKernel

由一組其他核心組成的核心。

ConstantKernel

DotProduct

ExpSineSquared

Exp-Sine-Squared 核心(又稱週期性核心)。

Exponentiation

指數核心採用一個基礎核心和一個純量參數。

Hyperparameter

以 namedtuple 形式的核心超參數規格。

Kernel

所有核心的基礎類別。

Matern

PairwiseKernel

sklearn.metrics.pairwise 中核心的包裝器。

Product

Product 核心採用兩個核心 \(k_1\)\(k_2\)

RBF

徑向基底函數核心(又稱平方指數核心)。

RationalQuadratic

有理二次核心。

Sum

Sum 核心採用兩個核心 \(k_1\)\(k_2\)

WhiteKernel

IterativeImputer

從所有其他特徵估計每個特徵的多變數填補器。

KNNImputer

使用 k 最近鄰居完成遺失值的填補。

MissingIndicator

遺失值的二元指標。

SimpleImputer

使用簡單策略完成遺失值的單變數填補器。

partial_dependence

features 的部分依賴。

permutation_importance

特徵評估的排列重要性 [Rd9e56ef97513-BRE]

DecisionBoundaryDisplay

決策邊界視覺化。

PartialDependenceDisplay

部分依賴圖 (PDP)。

IsotonicRegression

等張迴歸模型。

check_increasing

判斷 y 是否與 x 單調相關。

isotonic_regression

求解等張迴歸模型。

AdditiveChi2Sampler

附加 chi2 核心的近似特徵映射。

Nystroem

使用訓練資料的子集近似核心映射。

PolynomialCountSketch

透過 Tensor Sketch 近似多項式核心。

RBFSampler

使用隨機傅立葉特徵近似 RBF 核心特徵映射。

SkewedChi2Sampler

「偏斜卡方」核心的近似特徵映射。

KernelRidge

核心嶺迴歸。

LogisticRegression

邏輯迴歸(又稱 logit、MaxEnt)分類器。

LogisticRegressionCV

邏輯迴歸 CV(又稱 logit、MaxEnt)分類器。

PassiveAggressiveClassifier

被動攻擊分類器。

Perceptron

線性感知器分類器。

RidgeClassifier

使用嶺迴歸的分類器。

RidgeClassifierCV

具有內建交叉驗證的嶺分類器。

SGDClassifier

使用 SGD 訓練的線性分類器(SVM、邏輯迴歸等)。

SGDOneClassSVM

使用隨機梯度下降求解線性單類別 SVM。

LinearRegression

普通最小平方線性迴歸。

Ridge

具有 l2 正規化的線性最小平方。

RidgeCV

具有內建交叉驗證的嶺迴歸。

SGDRegressor

透過最小化帶有 SGD 的正規化經驗損失擬合的線性模型。

ElasticNet

具有組合 L1 和 L2 先驗作為正規化項的線性迴歸。

ElasticNetCV

沿著正規化路徑進行疊代擬合的 Elastic Net 模型。

Lars

最小角度迴歸模型,又稱 LAR。

LarsCV

交叉驗證的最小角度迴歸模型。

Lasso

以 L1 先驗作為正規化項訓練的線性模型(又稱 Lasso)。

LassoCV

沿著正規化路徑進行疊代擬合的 Lasso 線性模型。

LassoLars

使用最小角度迴歸(又稱 Lars)擬合的 Lasso 模型。

LassoLarsCV

使用 LARS 演算法進行交叉驗證的 Lasso。

LassoLarsIC

使用 Lars 擬合的 Lasso 模型,使用 BIC 或 AIC 進行模型選擇。

OrthogonalMatchingPursuit

正交匹配追蹤模型 (OMP)。

OrthogonalMatchingPursuitCV

交叉驗證的正交匹配追蹤模型 (OMP)。

ARDRegression

貝氏 ARD 迴歸。

BayesianRidge

貝氏嶺迴歸。

MultiTaskElasticNet

以 L1/L2 混合範數作為正規化項訓練的多任務 ElasticNet 模型。

MultiTaskElasticNetCV

具有內建交叉驗證的多任務 L1/L2 ElasticNet。

MultiTaskLasso

以 L1/L2 混合範數作為正規化項訓練的多任務 Lasso 模型。

MultiTaskLassoCV

以 L1/L2 混合範數作為正規化項訓練的多任務 Lasso 模型。

HuberRegressor

對離群值穩健的 L2 正規化線性迴歸模型。

QuantileRegressor

預測條件分位數的線性迴歸模型。

RANSACRegressor

RANSAC (RANdom SAmple Consensus) 演算法。

TheilSenRegressor

Theil-Sen 估計器:穩健的多變數迴歸模型。

GammaRegressor

具有伽瑪分佈的廣義線性模型。

PoissonRegressor

具有 Poisson 分佈的廣義線性模型。

TweedieRegressor

使用 Tweedie 分佈的廣義線性模型。

PassiveAggressiveRegressor

被動攻擊迴歸器。

enet_path

使用座標下降法計算彈性網格路徑。

lars_path

使用 LARS 演算法計算最小角度迴歸或 Lasso 路徑。

lars_path_gram

足夠統計模式下的 lars_path。

lasso_path

使用座標下降法計算 Lasso 路徑。

orthogonal_mp

正交匹配追蹤 (OMP)。

orthogonal_mp_gram

格拉姆正交匹配追蹤 (OMP)。

ridge_regression

用正規方程式的方法解嶺迴歸方程。

Isomap

等距映射嵌入。

LocallyLinearEmbedding

局部線性嵌入。

MDS

多維尺度分析。

SpectralEmbedding

用於非線性降維的譜嵌入。

TSNE

T 分佈隨機鄰近嵌入。

locally_linear_embedding

對資料執行局部線性嵌入分析。

smacof

使用 SMACOF 演算法計算多維尺度分析。

spectral_embedding

將樣本投影到圖拉普拉斯算子的第一個特徵向量上。

trustworthiness

指出局部結構保留的程度。

check_scoring

從使用者選項確定評分器。

get_scorer

從字串取得評分器。

get_scorer_names

取得所有可用評分器的名稱。

make_scorer

從效能指標或損失函數建立評分器。

accuracy_score

準確度分類分數。

auc

使用梯形法則計算曲線下面積 (AUC)。

average_precision_score

從預測分數計算平均精確度 (AP)。

balanced_accuracy_score

計算平衡準確度。

brier_score_loss

計算布萊爾分數損失。

class_likelihood_ratios

計算二元分類的陽性與陰性概似比。

classification_report

建立顯示主要分類指標的文字報告。

cohen_kappa_score

計算柯恩 Kappa 值:一種衡量評註者之間一致性的統計量。

confusion_matrix

計算混淆矩陣以評估分類的準確性。

d2_log_loss_score

\(D^2\) 分數函數,已解釋對數損失的比例。

dcg_score

計算折扣累積增益。

det_curve

計算不同機率閾值的錯誤率。

f1_score

計算 F1 分數,也稱為平衡 F 分數或 F 測度。

fbeta_score

計算 F-beta 分數。

hamming_loss

計算平均漢明損失。

hinge_loss

平均合頁損失(非正規化)。

jaccard_score

傑卡德相似係數分數。

log_loss

對數損失,又名邏輯損失或交叉熵損失。

matthews_corrcoef

計算馬修斯相關係數 (MCC)。

multilabel_confusion_matrix

計算每個類別或樣本的混淆矩陣。

ndcg_score

計算正規化折扣累積增益。

precision_recall_curve

計算不同機率閾值的精確度-召回率對。

precision_recall_fscore_support

計算每個類別的精確度、召回率、F 測度和支持度。

precision_score

計算精確度。

recall_score

計算召回率。

roc_auc_score

從預測分數計算接收者操作特徵曲線下面積 (ROC AUC)。

roc_curve

計算接收者操作特徵 (ROC)。

top_k_accuracy_score

前 k 名準確度分類分數。

zero_one_loss

零一分類損失。

d2_absolute_error_score

\(D^2\) 迴歸分數函數,已解釋絕對誤差的比例。

d2_pinball_score

\(D^2\) 迴歸分數函數,已解釋釘球損失的比例。

d2_tweedie_score

\(D^2\) 迴歸分數函數,已解釋 Tweedie 離差的比例。

explained_variance_score

已解釋變異數迴歸分數函數。

max_error

max_error 指標計算最大殘差誤差。

mean_absolute_error

平均絕對誤差迴歸損失。

mean_absolute_percentage_error

平均絕對百分比誤差 (MAPE) 迴歸損失。

mean_gamma_deviance

平均伽瑪離差迴歸損失。

mean_pinball_loss

分位數迴歸的釘球損失。

mean_poisson_deviance

平均泊松離差迴歸損失。

mean_squared_error

均方誤差迴歸損失。

mean_squared_log_error

平均平方對數誤差迴歸損失。

mean_tweedie_deviance

平均 Tweedie 離差迴歸損失。

median_absolute_error

中位數絕對誤差迴歸損失。

r2_score

\(R^2\) (決定係數)迴歸分數函數。

root_mean_squared_error

均方根誤差迴歸損失。

root_mean_squared_log_error

均方根對數誤差迴歸損失。

coverage_error

覆蓋率誤差度量。

label_ranking_average_precision_score

計算基於排序的平均精確度。

label_ranking_loss

計算排序損失度量。

adjusted_mutual_info_score

兩個群聚之間調整後的互資訊。

adjusted_rand_score

針對機率調整的蘭德指數。

calinski_harabasz_score

計算卡林斯基和哈拉巴斯分數。

contingency_matrix

建立描述標籤之間關係的列聯表。

pair_confusion_matrix

由兩個群聚產生的成對混淆矩陣。

completeness_score

計算給定基本事實的群聚標記的完整性指標。

davies_bouldin_score

計算戴維斯-鮑爾丁分數。

fowlkes_mallows_score

衡量一組點的兩個群聚的相似性。

homogeneity_completeness_v_measure

一次計算同質性、完整性和 V-Measure 分數。

homogeneity_score

給定基本事實的群聚標記的同質性指標。

mutual_info_score

兩個群聚之間的互資訊。

normalized_mutual_info_score

兩個群聚之間的正規化互資訊。

rand_score

蘭德指數。

silhouette_samples

計算每個樣本的輪廓係數。

silhouette_score

計算所有樣本的平均輪廓係數。

v_measure_score

給定基本事實的 V-測度群聚標記。

consensus_score

兩組雙聚類的相似性。

DistanceMetric

快速距離度量函數的統一介面。

additive_chi2_kernel

計算 X 和 Y 中觀察值之間的加性卡方核函數。

chi2_kernel

計算 X 和 Y 之間的指數卡方核函數。

cosine_distances

計算 X 和 Y 中樣本之間的餘弦距離。

cosine_similarity

計算 X 和 Y 中樣本之間的餘弦相似性。

distance_metrics

pairwise_distances 的有效指標。

euclidean_distances

計算向量陣列 X 和 Y 中每一對之間的距離矩陣。

haversine_distances

計算 X 和 Y 中樣本之間的半正矢距離。

kernel_metrics

pairwise_kernels 的有效指標。

laplacian_kernel

計算 X 和 Y 之間的拉普拉斯核函數。

linear_kernel

計算 X 和 Y 之間的線性核函數。

manhattan_distances

計算 X 和 Y 中向量之間的 L1 距離。

nan_euclidean_distances

計算存在遺失值時的歐幾里得距離。

paired_cosine_distances

計算 X 和 Y 之間的成對餘弦距離。

paired_distances

計算 X 和 Y 之間的成對距離。

paired_euclidean_distances

計算 X 和 Y 之間的成對歐幾里得距離。

paired_manhattan_distances

計算 X 和 Y 之間的成對 L1 距離。

pairwise_kernels

計算陣列 X 與可選陣列 Y 之間的核函數。

polynomial_kernel

計算 X 和 Y 之間的多項式核函數。

rbf_kernel

計算 X 和 Y 之間的 rbf (高斯) 核函數。

sigmoid_kernel

計算 X 和 Y 之間的 sigmoid 核函數。

pairwise_distances

計算向量陣列 X 和可選 Y 的距離矩陣。

pairwise_distances_argmin

計算一個點與一組點之間的最小距離。

pairwise_distances_argmin_min

計算一個點與一組點之間的最小距離。

pairwise_distances_chunked

使用可選的縮減逐塊生成距離矩陣。

ConfusionMatrixDisplay

混淆矩陣視覺化。

DetCurveDisplay

DET 曲線視覺化。

PrecisionRecallDisplay

精確度-召回率視覺化。

PredictionErrorDisplay

迴歸模型預測誤差的視覺化。

RocCurveDisplay

ROC 曲線視覺化。

BayesianGaussianMixture

高斯混合的變分貝氏估計。

GaussianMixture

高斯混合模型。

GroupKFold

具有非重疊群組的 K 折疊迭代器變體。

GroupShuffleSplit

Shuffle-Group(s)-Out 交叉驗證迭代器。

KFold

K 折疊交叉驗證器。

LeaveOneGroupOut

留一組交叉驗證器。

LeaveOneOut

留一法交叉驗證器。

LeavePGroupsOut

留 P 組交叉驗證器。

LeavePOut

留 P 法交叉驗證器。

PredefinedSplit

預定義分割交叉驗證器。

RepeatedKFold

重複 K 折疊交叉驗證器。

RepeatedStratifiedKFold

重複分層 K 折疊交叉驗證器。

ShuffleSplit

隨機排列交叉驗證器。

StratifiedGroupKFold

具有非重疊群組的分層 K 折疊迭代器變體。

StratifiedKFold

分層 K 折疊交叉驗證器。

StratifiedShuffleSplit

分層 ShuffleSplit 交叉驗證器。

TimeSeriesSplit

時間序列交叉驗證器。

check_cv

用於建立交叉驗證器的輸入檢查工具。

train_test_split

將陣列或矩陣分割成隨機訓練和測試子集。

GridSearchCV

針對估算器在指定的參數值上進行窮舉搜尋。

HalvingGridSearchCV

使用連續減半法在指定的參數值上進行搜尋。

HalvingRandomSearchCV

在超參數上進行隨機搜尋。

ParameterGrid

參數網格,每個參數都具有離散數量的數值。

ParameterSampler

從給定分佈中採樣的參數產生器。

RandomizedSearchCV

在超參數上進行隨機搜尋。

FixedThresholdClassifier

手動設定決策閾值的二元分類器。

TunedThresholdClassifierCV

使用交叉驗證後調整決策閾值的分類器。

cross_val_predict

為每個輸入資料點產生交叉驗證的估計值。

cross_val_score

通過交叉驗證評估分數。

cross_validate

通過交叉驗證評估指標,並記錄擬合/評分時間。

learning_curve

學習曲線。

permutation_test_score

使用置換檢定評估交叉驗證分數的顯著性。

validation_curve

驗證曲線。

LearningCurveDisplay

學習曲線視覺化。

ValidationCurveDisplay

驗證曲線視覺化。

OneVsOneClassifier

一對一多類策略。

OneVsRestClassifier

一對多 (OvR) 多類策略。

OutputCodeClassifier

(錯誤校正)輸出碼多類策略。

ClassifierChain

將二元分類器排列成鏈的多標籤模型。

MultiOutputClassifier

多目標分類。

MultiOutputRegressor

多目標迴歸。

RegressorChain

將迴歸模型排列成鏈的多標籤模型。

BernoulliNB

用於多變量伯努利模型的樸素貝葉斯分類器。

CategoricalNB

用於類別特徵的樸素貝葉斯分類器。

ComplementNB

Rennie 等人 (2003) 中描述的互補樸素貝葉斯分類器。

GaussianNB

高斯樸素貝葉斯 (GaussianNB)。

MultinomialNB

用於多項式模型的樸素貝葉斯分類器。

BallTree

用於快速廣義 N 點問題的 BallTree。

KDTree

用於快速廣義 N 點問題的 KDTree。

KNeighborsClassifier

實作 k 近鄰投票的分類器。

KNeighborsRegressor

基於 k 近鄰的迴歸。

KNeighborsTransformer

將 X 轉換為 k 近鄰的(加權)圖形。

KernelDensity

核密度估計。

LocalOutlierFactor

使用局部離群因子 (LOF) 的無監督離群值檢測。

NearestCentroid

最近質心分類器。

NearestNeighbors

用於實作鄰近搜尋的無監督學習器。

NeighborhoodComponentsAnalysis

鄰域成分分析。

RadiusNeighborsClassifier

實作在給定半徑內鄰近投票的分類器。

RadiusNeighborsRegressor

基於固定半徑內鄰近的迴歸。

RadiusNeighborsTransformer

將 X 轉換為半徑小於特定值的鄰近(加權)圖形。

kneighbors_graph

計算 X 中點的 k 近鄰(加權)圖形。

radius_neighbors_graph

計算 X 中點的鄰近(加權)圖形。

sort_graph_by_row_values

排序稀疏圖,使每行都以遞增的值儲存。

BernoulliRBM

伯努利受限玻爾茲曼機 (RBM)。

MLPClassifier

多層感知器分類器。

MLPRegressor

多層感知器迴歸器。

FeatureUnion

串聯多個轉換器物件的結果。

Pipeline

具有可選最終預測器的資料轉換器序列。

make_pipeline

從給定的估算器建構 Pipeline

make_union

從給定的轉換器建構 FeatureUnion

Binarizer

根據閾值二值化資料(將特徵值設定為 0 或 1)。

FunctionTransformer

從任意可呼叫對象建構轉換器。

KBinsDiscretizer

將連續資料分組到間隔中。

KernelCenterer

將任意核矩陣 \(K\) 置中。

LabelBinarizer

以一對多方式二值化標籤。

LabelEncoder

使用 0 到 n_classes-1 之間的值編碼目標標籤。

MaxAbsScaler

將每個特徵縮放到其最大絕對值。

MinMaxScaler

通過將每個特徵縮放到給定範圍來轉換特徵。

MultiLabelBinarizer

在可迭代的迭代器和多標籤格式之間轉換。

Normalizer

將樣本單獨正規化為單位範數。

OneHotEncoder

將類別特徵編碼為獨熱數值陣列。

OrdinalEncoder

將類別特徵編碼為整數陣列。

PolynomialFeatures

產生多項式和交互特徵。

PowerTransformer

逐個特徵應用冪轉換,使資料更像高斯分佈。

QuantileTransformer

使用分位數資訊轉換特徵。

RobustScaler

使用對離群值穩健的統計資訊來縮放特徵。

SplineTransformer

為特徵產生單變數 B 樣條基底。

StandardScaler

通過移除平均值並縮放到單位變異數來標準化特徵。

TargetEncoder

用於迴歸和分類目標的目標編碼器。

add_dummy_feature

使用額外的虛擬特徵來擴增資料集。

binarize

類似陣列或 scipy.sparse 矩陣的布林閾值處理。

label_binarize

以一對多方式二值化標籤。

maxabs_scale

將每個特徵縮放到 [-1, 1] 範圍,而不會破壞稀疏性。

minmax_scale

通過將每個特徵縮放到給定範圍來轉換特徵。

normalize

將輸入向量個別縮放到單位範數(向量長度)。

power_transform

用於使資料更像高斯分佈的參數化單調轉換。

quantile_transform

使用分位數資訊轉換特徵。

robust_scale

沿著任何軸標準化資料集。

scale

沿著任何軸標準化資料集。

GaussianRandomProjection

透過高斯隨機投影降低維度。

SparseRandomProjection

透過稀疏隨機投影降低維度。

johnson_lindenstrauss_min_dim

找到一個「安全」的組件數量以隨機投影到。

LabelPropagation

標籤傳播分類器。

LabelSpreading

用於半監督學習的標籤擴散模型。

SelfTrainingClassifier

自我訓練分類器。

LinearSVC

線性支援向量分類。

LinearSVR

線性支援向量迴歸。

NuSVC

Nu 支援向量分類。

NuSVR

Nu 支援向量迴歸。

OneClassSVM

無監督離群值檢測。

SVC

C 支援向量分類。

SVR

Epsilon 支援向量迴歸。

l1_min_c

傳回 C 的下限。

DecisionTreeClassifier

決策樹分類器。

DecisionTreeRegressor

決策樹迴歸器。

ExtraTreeClassifier

極度隨機樹分類器。

ExtraTreeRegressor

極度隨機樹迴歸器。

export_graphviz

以 DOT 格式匯出決策樹。

export_text

建立顯示決策樹規則的文字報告。

plot_tree

繪製決策樹。

Bunch

將鍵值公開為屬性的容器物件。

_safe_indexing

使用索引傳回 X 的列、項目或欄位。

as_float_array

將類似陣列的資料轉換為浮點數陣列。

assert_all_finite

如果 X 包含 NaN 或無窮大,則拋出 ValueError。

deprecated

將函數或類別標記為已棄用的裝飾器。

estimator_html_repr

建立估算器的 HTML 表示法。

gen_batches

產生器,用於建立包含從 0 到 nbatch_size 個元素的切片。

gen_even_slices

產生器,用於建立均勻間隔的 n_packs 個切片,直到 n

indexable

使陣列可索引以進行交叉驗證。

murmurhash3_32

計算種子處的鍵的 32 位元 murmurhash3。

resample

以一致的方式重新採樣陣列或稀疏矩陣。

safe_mask

傳回可在 X 上安全使用的遮罩。

safe_sqr

類似陣列和稀疏矩陣的逐元素平方。

shuffle

以一致的方式隨機排列陣列或稀疏矩陣。

Tags

估算器的標籤。

InputTags

輸入資料的標籤。

TargetTags

目標資料的標籤。

ClassifierTags

分類器的標籤。

RegressorTags

迴歸器的標籤。

TransformerTags

轉換器的標籤。

get_tags

取得估算器標籤。

check_X_y

標準估算器的輸入驗證。

check_array

針對陣列、清單、稀疏矩陣或類似的輸入驗證。

check_consistent_length

檢查所有陣列是否具有一致的第一維度。

check_random_state

將種子轉換為 np.random.RandomState 實例。

check_scalar

驗證純量參數類型和值。

check_is_fitted

為估算器執行 is_fitted 驗證。

check_memory

檢查 memory 是否類似 joblib.Memory。

check_symmetric

確保陣列是 2D、正方形且對稱的。

column_or_1d

攤平欄或 1d numpy 陣列,否則引發錯誤。

has_fit_parameter

檢查估算器的 fit 方法是否支援給定的參數。

validate_data

驗證輸入數據,並設定或檢查輸入的特徵名稱和計數。

available_if

只有在檢查返回真值時才可用的屬性。

compute_class_weight

估計不平衡數據集的類別權重。

compute_sample_weight

針對不平衡數據集,按類別估計樣本權重。

is_multilabel

檢查 y 是否為多標籤格式。

type_of_target

判斷目標所指示的數據類型。

unique_labels

提取唯一的標籤的排序陣列。

density

計算稀疏向量的密度。

fast_logdet

計算方陣行列式的對數。

randomized_range_finder

計算一個正交矩陣,其範圍近似於 A 的範圍。

randomized_svd

計算截斷的隨機 SVD。

safe_sparse_dot

正確處理稀疏矩陣情況的點積。

weighted_mode

返回傳遞陣列中加權眾數(最常見)值的陣列。

incr_mean_variance_axis

計算 CSR 或 CSC 矩陣沿軸的增量平均值和變異數。

inplace_column_scale

原地調整 CSC/CSR 矩陣的列縮放比例。

inplace_csr_column_scale

原地調整 CSR 矩陣的列縮放比例。

inplace_row_scale

原地調整 CSR 或 CSC 矩陣的列縮放比例。

inplace_swap_column

原地交換 CSC/CSR 矩陣的兩列。

inplace_swap_row

原地交換 CSC/CSR 矩陣的兩列。

mean_variance_axis

計算 CSR 或 CSC 矩陣沿軸的平均值和變異數。

inplace_csr_row_normalize_l1

原地將 CSR 矩陣或陣列的行按其 L1 範數歸一化。

inplace_csr_row_normalize_l2

原地將 CSR 矩陣或陣列的行按其 L2 範數歸一化。

single_source_shortest_path_length

返回從源點到所有可達節點的最短路徑長度。

sample_without_replacement

不重複地抽取整數樣本。

min_pos

查找陣列中正值的最小值。

MetadataRequest

包含消費者的中繼資料請求資訊。

MetadataRouter

儲存並處理路由器物件的中繼資料路由。

MethodMapping

儲存路由器的呼叫者和被呼叫者方法之間的映射。

get_routing_for_object

從給定物件取得 Metadata{Router, Request} 實例。

process_routing

驗證並路由輸入參數。

all_displays

sklearn 取得所有顯示的列表。

all_estimators

sklearn 取得所有估計器的列表。

all_functions

sklearn 取得所有函式的列表。

check_estimator

檢查估計器是否符合 scikit-learn 慣例。

parametrize_with_checks

用於參數化估計器檢查的 Pytest 特定裝飾器。

estimator_checks_generator

迭代產生估計器的所有檢查可呼叫物件。

Parallel

joblib.Parallel 的調整,其會傳播 scikit-learn 配置。

delayed

用於捕獲函式參數的裝飾器。

parallel_backend

在 with 區塊內變更 Parallel 使用的預設後端。

register_parallel_backend

註冊新的 Parallel 後端工廠。