API Reference#
這是 scikit-learn 的類別和函式參考。請參閱完整使用者指南以取得更多詳細資訊,因為類別和函式的原始規格可能不足以提供其使用上的完整指南。如需關於 API 中重複出現的概念的參考,請參閱常用詞彙和 API 元素的詞彙表。
物件 |
描述 |
---|---|
用於全域 scikit-learn 設定的上下文管理器。 |
|
檢索由 |
|
設定全域 scikit-learn 配置。 |
|
印出有用的除錯資訊 |
|
scikit-learn 中所有估計器的基底類別。 |
|
scikit-learn 中所有雙聚類估計器的混合類別。 |
|
透過前綴產生自身名稱的轉換器的混合類別。 |
|
scikit-learn 中所有分類器的混合類別。 |
|
scikit-learn 中所有叢集估計器的混合類別。 |
|
scikit-learn 中所有密度估計器的混合類別。 |
|
scikit-learn 中所有元估計器的混合類別。 |
|
為簡單轉換器提供 |
|
scikit-learn 中所有離群值偵測估計器的混合類別。 |
|
scikit-learn 中所有迴歸估計器的混合類別。 |
|
scikit-learn 中所有轉換器的混合類別。 |
|
使用相同的參數建構一個新的未擬合的估計器。 |
|
如果給定的估計器(可能)是分類器,則返回 True。 |
|
如果給定的估計器(可能)是分群器,則返回 True。 |
|
如果給定的估計器(可能)是迴歸器,則返回 True。 |
|
如果給定的估計器(可能)是離群值偵測器,則返回 True。 |
|
使用等張迴歸或邏輯迴歸進行機率校準。 |
|
計算校準曲線的真實和預測機率。 |
|
校準曲線(也稱為可靠性圖)視覺化。 |
|
對資料執行親和力傳播分群。 |
|
聚合分群。 |
|
實作 BIRCH 分群演算法。 |
|
二分 K-Means 分群。 |
|
從向量陣列或距離矩陣執行 DBSCAN 分群。 |
|
聚合特徵。 |
|
使用基於階層密度的分群來分群資料。 |
|
K-Means 分群。 |
|
使用平坦核心進行均值漂移分群。 |
|
Mini-Batch K-Means 分群。 |
|
從向量陣列估計分群結構。 |
|
頻譜雙分群(Kluger, 2003)。 |
|
將分群應用於正規化拉普拉斯算子的投影。 |
|
頻譜共分群演算法(Dhillon, 2001)。 |
|
對資料執行親和力傳播分群。 |
|
對任意 epsilon 執行 DBSCAN 提取。 |
|
根據 Xi 陡峭法自動提取叢集。 |
|
計算 OPTICS 可達性圖。 |
|
從向量陣列或距離矩陣執行 DBSCAN 分群。 |
|
估計與均值漂移演算法一起使用的頻寬。 |
|
執行 K-means 分群演算法。 |
|
根據 k-means++ 初始化 n_clusters 個種子。 |
|
使用平坦核心對資料執行均值漂移分群。 |
|
將分群應用於正規化拉普拉斯算子的投影。 |
|
基於特徵矩陣的 Ward 分群。 |
|
將轉換器應用於陣列或 pandas DataFrame 的列。 |
|
對轉換後的目標進行迴歸的元估計器。 |
|
建立一個可呼叫的物件,用於選擇要使用的列 |
|
從給定的轉換器建構 ColumnTransformer。 |
|
用於偵測高斯分佈資料集中離群值的物件。 |
|
最大概似共變異數估計器。 |
|
具有 l1 懲罰估計器的稀疏逆共變異數估計。 |
|
使用交叉驗證選擇 l1 懲罰的稀疏逆共變異數。 |
|
LedoitWolf 估計器。 |
|
最小共變異數行列式 (MCD):共變異數的穩健估計器。 |
|
神諭近似收縮估計器。 |
|
具有收縮的共變異數估計器。 |
|
計算最大概似共變異數估計器。 |
|
L1 懲罰的共變異數估計器。 |
|
估計收縮的 Ledoit-Wolf 共變異數矩陣。 |
|
估計收縮的 Ledoit-Wolf 共變異數矩陣。 |
|
使用神諭近似收縮來估計共變異數。 |
|
計算對角線收縮的共變異數矩陣。 |
|
典型相關分析,也稱為「模式 B」PLS。 |
|
偏最小平方轉換器和迴歸器。 |
|
PLS 迴歸。 |
|
偏最小平方 SVD。 |
|
刪除資料主目錄快取中的所有內容。 |
|
以 svmlight / libsvm 檔案格式轉儲資料集。 |
|
從 20 個新聞群組資料集(分類)載入檔案名稱和資料。 |
|
載入並向量化 20 個新聞群組資料集(分類)。 |
|
載入加州房屋資料集(迴歸)。 |
|
載入 covertype 資料集(分類)。 |
|
如果本機資料夾中尚不存在,則從網路上取得檔案。 |
|
載入 kddcup99 資料集(分類)。 |
|
載入野外標記人臉 (LFW) 配對資料集(分類)。 |
|
載入野外標記人臉 (LFW) 人員資料集(分類)。 |
|
從 AT&T 載入 Olivetti 人臉資料集(分類)。 |
|
按名稱或資料集 ID 從 openml 取得資料集。 |
|
載入 RCV1 多標籤資料集(分類)。 |
|
從 Phillips 等人(2006 年)載入物種分佈資料集。 |
|
返回 scikit-learn 資料目錄的路徑。 |
|
載入並返回乳癌威斯康辛資料集(分類)。 |
|
載入並返回糖尿病資料集(迴歸)。 |
|
載入並返回數字資料集(分類)。 |
|
載入以類別作為子資料夾名稱的文字檔。 |
|
載入並返回鳶尾花資料集(分類)。 |
|
載入並返回體能運動 Linnerud 資料集。 |
|
載入單一範例影像的 numpy 陣列。 |
|
載入用於影像處理的範例影像。 |
|
以 svmlight / libsvm 格式將資料集載入到稀疏 CSR 矩陣中。 |
|
從 SVMlight 格式的多個檔案載入資料集。 |
|
載入並返回葡萄酒資料集(分類)。 |
|
產生用於雙分群的常數區塊對角結構陣列。 |
|
產生用於分群的同向高斯 blob。 |
|
產生用於雙分群的具有區塊棋盤結構的陣列。 |
|
在 2d 中製作一個包含較小圓圈的大圓圈。 |
|
產生一個隨機的 n 類分類問題。 |
|
產生「Friedman #1」迴歸問題。 |
|
產生「Friedman #2」迴歸問題。 |
|
產生「Friedman #3」迴歸問題。 |
|
產生同向高斯和按分位數標記樣本。 |
|
產生用於 Hastie 等人 2009 年範例 10.2 中使用的二元分類資料。 |
|
產生一個具有鐘形奇異值的低階矩陣。 |
|
製作兩個交錯的半圓。 |
|
產生一個隨機的多標籤分類問題。 |
|
產生一個隨機的迴歸問題。 |
|
產生一個 S 曲線資料集。 |
|
產生一個信號作為字典元素的稀疏組合。 |
|
產生一個稀疏對稱正定矩陣。 |
|
產生一個具有稀疏不相關設計的隨機迴歸問題。 |
|
產生一個隨機的對稱正定矩陣。 |
|
產生一個瑞士捲資料集。 |
|
字典學習。 |
|
因子分析 (FA)。 |
|
FastICA:用於獨立成分分析的快速演算法。 |
|
增量主成分分析 (IPCA)。 |
|
核心主成分分析 (KPCA)。 |
|
具有線上變分貝氏演算法的潛在狄利克雷分配。 |
|
Mini-batch 字典學習。 |
|
Mini-Batch 非負矩陣分解 (NMF)。 |
|
Mini-batch 稀疏主成分分析。 |
|
非負矩陣分解 (NMF)。 |
|
主成分分析 (PCA)。 |
|
稀疏編碼。 |
|
稀疏主成分分析 (SparsePCA)。 |
|
使用截斷 SVD(又稱 LSA)進行降維。 |
|
解決字典學習矩陣分解問題。 |
|
線上解決字典學習矩陣分解問題。 |
|
執行快速獨立成分分析。 |
|
計算非負矩陣分解 (NMF)。 |
|
稀疏編碼。 |
|
線性判別分析。 |
|
二次判別分析。 |
|
DummyClassifier 進行忽略輸入特徵的預測。 |
|
使用簡單規則進行預測的迴歸器。 |
|
AdaBoost 分類器。 |
|
AdaBoost 迴歸器。 |
|
Bagging 分類器。 |
|
Bagging 迴歸器。 |
|
額外樹狀分類器。 |
|
額外樹狀迴歸器。 |
|
用於分類的梯度提升。 |
|
用於迴歸的梯度提升。 |
|
基於長條圖的梯度提升分類樹。 |
|
基於長條圖的梯度提升迴歸樹。 |
|
隔離森林演算法。 |
|
隨機森林分類器。 |
|
隨機森林迴歸器。 |
|
完全隨機樹的集成。 |
|
堆疊多個估計器,並以最終分類器作結。 |
|
堆疊多個估計器,並以最終迴歸器作結。 |
|
用於未擬合估計器的軟投票/多數決分類器。 |
|
用於未擬合估計器的預測投票迴歸器。 |
|
用於捕捉收斂問題的自訂警告。 |
|
用於通知程式碼中發生的隱式資料轉換的警告。 |
|
用於通知資料維度潛在問題的自訂警告。 |
|
用於通知使用者計算效率不佳的警告。 |
|
如果在擬合估計器時發生錯誤,則使用的警告類別。 |
|
當估計器以不一致的版本還原序列化時發出的警告。 |
|
如果估計器在擬合前被使用,則引發的例外類別。 |
|
當度量無效時使用的警告。 |
|
當來自常見測試的估計器檢查失敗時發出的警告。 |
|
啟用連續減半搜尋估計器。 |
|
啟用 IterativeImputer。 |
|
將特徵值映射列表轉換為向量。 |
|
實作特徵雜湊,又稱雜湊技巧。 |
|
從影像集合中提取圖塊。 |
|
將 2D 影像重新塑形為圖塊集合。 |
|
像素到像素連接的圖形。 |
|
像素到像素梯度連接的圖形。 |
|
從所有圖塊重建影像。 |
|
將文字文件集合轉換為詞符計數矩陣。 |
|
將文字文件集合轉換為詞符出現次數矩陣。 |
|
將計數矩陣轉換為標準化的 tf 或 tf-idf 表示法。 |
|
將原始文件集合轉換為 TF-IDF 特徵矩陣。 |
|
具有可設定策略的單變數特徵選擇器。 |
|
使用遞迴特徵消除進行特徵排名。 |
|
使用交叉驗證進行遞迴特徵消除以選擇特徵。 |
|
篩選器:選取估計偽發現率的 p 值。 |
|
篩選器:根據 FPR 測試選取低於 alpha 的 p 值。 |
|
用於根據重要性權重選取特徵的中繼轉換器。 |
|
篩選器:選取對應於 Family-wise 錯誤率的 p 值。 |
|
根據 k 個最高分數選取特徵。 |
|
根據最高分數的百分位數選取特徵。 |
|
執行特徵選擇(給定支援遮罩)的轉換器混合。 |
|
執行序列特徵選擇的轉換器。 |
|
移除所有低變異數特徵的特徵選擇器。 |
|
計算每個非負特徵和類別之間的卡方統計量。 |
|
計算提供樣本的 ANOVA F 值。 |
|
傳回 F 統計量和 p 值的單變數線性迴歸測試。 |
|
估計離散目標變數的互資訊。 |
|
估計連續目標變數的互資訊。 |
|
計算每個特徵和目標的皮爾森 r 值。 |
|
包裝擬合估計器以防止重新擬合的估計器。 |
|
基於 Laplace 近似的 Gaussian process 分類 (GPC)。 |
|
Gaussian process 迴歸 (GPR)。 |
|
由一組其他核心組成的核心。 |
|
Exp-Sine-Squared 核心(又稱週期性核心)。 |
|
指數核心採用一個基礎核心和一個純量參數。 |
|
以 namedtuple 形式的核心超參數規格。 |
|
所有核心的基礎類別。 |
|
Matern 核心。 |
|
sklearn.metrics.pairwise 中核心的包裝器。 |
|
|
|
徑向基底函數核心(又稱平方指數核心)。 |
|
有理二次核心。 |
|
|
|
從所有其他特徵估計每個特徵的多變數填補器。 |
|
使用 k 最近鄰居完成遺失值的填補。 |
|
遺失值的二元指標。 |
|
使用簡單策略完成遺失值的單變數填補器。 |
|
|
|
特徵評估的排列重要性 [Rd9e56ef97513-BRE]。 |
|
決策邊界視覺化。 |
|
部分依賴圖 (PDP)。 |
|
等張迴歸模型。 |
|
判斷 y 是否與 x 單調相關。 |
|
求解等張迴歸模型。 |
|
附加 chi2 核心的近似特徵映射。 |
|
使用訓練資料的子集近似核心映射。 |
|
透過 Tensor Sketch 近似多項式核心。 |
|
使用隨機傅立葉特徵近似 RBF 核心特徵映射。 |
|
「偏斜卡方」核心的近似特徵映射。 |
|
核心嶺迴歸。 |
|
邏輯迴歸(又稱 logit、MaxEnt)分類器。 |
|
邏輯迴歸 CV(又稱 logit、MaxEnt)分類器。 |
|
被動攻擊分類器。 |
|
線性感知器分類器。 |
|
使用嶺迴歸的分類器。 |
|
具有內建交叉驗證的嶺分類器。 |
|
使用 SGD 訓練的線性分類器(SVM、邏輯迴歸等)。 |
|
使用隨機梯度下降求解線性單類別 SVM。 |
|
普通最小平方線性迴歸。 |
|
具有 l2 正規化的線性最小平方。 |
|
具有內建交叉驗證的嶺迴歸。 |
|
透過最小化帶有 SGD 的正規化經驗損失擬合的線性模型。 |
|
具有組合 L1 和 L2 先驗作為正規化項的線性迴歸。 |
|
沿著正規化路徑進行疊代擬合的 Elastic Net 模型。 |
|
最小角度迴歸模型,又稱 LAR。 |
|
交叉驗證的最小角度迴歸模型。 |
|
以 L1 先驗作為正規化項訓練的線性模型(又稱 Lasso)。 |
|
沿著正規化路徑進行疊代擬合的 Lasso 線性模型。 |
|
使用最小角度迴歸(又稱 Lars)擬合的 Lasso 模型。 |
|
使用 LARS 演算法進行交叉驗證的 Lasso。 |
|
使用 Lars 擬合的 Lasso 模型,使用 BIC 或 AIC 進行模型選擇。 |
|
正交匹配追蹤模型 (OMP)。 |
|
交叉驗證的正交匹配追蹤模型 (OMP)。 |
|
貝氏 ARD 迴歸。 |
|
貝氏嶺迴歸。 |
|
以 L1/L2 混合範數作為正規化項訓練的多任務 ElasticNet 模型。 |
|
具有內建交叉驗證的多任務 L1/L2 ElasticNet。 |
|
以 L1/L2 混合範數作為正規化項訓練的多任務 Lasso 模型。 |
|
以 L1/L2 混合範數作為正規化項訓練的多任務 Lasso 模型。 |
|
對離群值穩健的 L2 正規化線性迴歸模型。 |
|
預測條件分位數的線性迴歸模型。 |
|
RANSAC (RANdom SAmple Consensus) 演算法。 |
|
Theil-Sen 估計器:穩健的多變數迴歸模型。 |
|
具有伽瑪分佈的廣義線性模型。 |
|
具有 Poisson 分佈的廣義線性模型。 |
|
使用 Tweedie 分佈的廣義線性模型。 |
|
被動攻擊迴歸器。 |
|
使用座標下降法計算彈性網格路徑。 |
|
使用 LARS 演算法計算最小角度迴歸或 Lasso 路徑。 |
|
足夠統計模式下的 lars_path。 |
|
使用座標下降法計算 Lasso 路徑。 |
|
正交匹配追蹤 (OMP)。 |
|
格拉姆正交匹配追蹤 (OMP)。 |
|
用正規方程式的方法解嶺迴歸方程。 |
|
等距映射嵌入。 |
|
局部線性嵌入。 |
|
多維尺度分析。 |
|
用於非線性降維的譜嵌入。 |
|
T 分佈隨機鄰近嵌入。 |
|
對資料執行局部線性嵌入分析。 |
|
使用 SMACOF 演算法計算多維尺度分析。 |
|
將樣本投影到圖拉普拉斯算子的第一個特徵向量上。 |
|
指出局部結構保留的程度。 |
|
從使用者選項確定評分器。 |
|
從字串取得評分器。 |
|
取得所有可用評分器的名稱。 |
|
從效能指標或損失函數建立評分器。 |
|
準確度分類分數。 |
|
使用梯形法則計算曲線下面積 (AUC)。 |
|
從預測分數計算平均精確度 (AP)。 |
|
計算平衡準確度。 |
|
計算布萊爾分數損失。 |
|
計算二元分類的陽性與陰性概似比。 |
|
建立顯示主要分類指標的文字報告。 |
|
計算柯恩 Kappa 值:一種衡量評註者之間一致性的統計量。 |
|
計算混淆矩陣以評估分類的準確性。 |
|
\(D^2\) 分數函數,已解釋對數損失的比例。 |
|
計算折扣累積增益。 |
|
計算不同機率閾值的錯誤率。 |
|
計算 F1 分數,也稱為平衡 F 分數或 F 測度。 |
|
計算 F-beta 分數。 |
|
計算平均漢明損失。 |
|
平均合頁損失(非正規化)。 |
|
傑卡德相似係數分數。 |
|
對數損失,又名邏輯損失或交叉熵損失。 |
|
計算馬修斯相關係數 (MCC)。 |
|
計算每個類別或樣本的混淆矩陣。 |
|
計算正規化折扣累積增益。 |
|
計算不同機率閾值的精確度-召回率對。 |
|
計算每個類別的精確度、召回率、F 測度和支持度。 |
|
計算精確度。 |
|
計算召回率。 |
|
從預測分數計算接收者操作特徵曲線下面積 (ROC AUC)。 |
|
計算接收者操作特徵 (ROC)。 |
|
前 k 名準確度分類分數。 |
|
零一分類損失。 |
|
\(D^2\) 迴歸分數函數,已解釋絕對誤差的比例。 |
|
\(D^2\) 迴歸分數函數,已解釋釘球損失的比例。 |
|
\(D^2\) 迴歸分數函數,已解釋 Tweedie 離差的比例。 |
|
已解釋變異數迴歸分數函數。 |
|
max_error 指標計算最大殘差誤差。 |
|
平均絕對誤差迴歸損失。 |
|
平均絕對百分比誤差 (MAPE) 迴歸損失。 |
|
平均伽瑪離差迴歸損失。 |
|
分位數迴歸的釘球損失。 |
|
平均泊松離差迴歸損失。 |
|
均方誤差迴歸損失。 |
|
平均平方對數誤差迴歸損失。 |
|
平均 Tweedie 離差迴歸損失。 |
|
中位數絕對誤差迴歸損失。 |
|
\(R^2\) (決定係數)迴歸分數函數。 |
|
均方根誤差迴歸損失。 |
|
均方根對數誤差迴歸損失。 |
|
覆蓋率誤差度量。 |
|
計算基於排序的平均精確度。 |
|
計算排序損失度量。 |
|
兩個群聚之間調整後的互資訊。 |
|
針對機率調整的蘭德指數。 |
|
計算卡林斯基和哈拉巴斯分數。 |
|
建立描述標籤之間關係的列聯表。 |
|
由兩個群聚產生的成對混淆矩陣。 |
|
計算給定基本事實的群聚標記的完整性指標。 |
|
計算戴維斯-鮑爾丁分數。 |
|
衡量一組點的兩個群聚的相似性。 |
|
一次計算同質性、完整性和 V-Measure 分數。 |
|
給定基本事實的群聚標記的同質性指標。 |
|
兩個群聚之間的互資訊。 |
|
兩個群聚之間的正規化互資訊。 |
|
蘭德指數。 |
|
計算每個樣本的輪廓係數。 |
|
計算所有樣本的平均輪廓係數。 |
|
給定基本事實的 V-測度群聚標記。 |
|
兩組雙聚類的相似性。 |
|
快速距離度量函數的統一介面。 |
|
計算 X 和 Y 中觀察值之間的加性卡方核函數。 |
|
計算 X 和 Y 之間的指數卡方核函數。 |
|
計算 X 和 Y 中樣本之間的餘弦距離。 |
|
計算 X 和 Y 中樣本之間的餘弦相似性。 |
|
pairwise_distances 的有效指標。 |
|
計算向量陣列 X 和 Y 中每一對之間的距離矩陣。 |
|
計算 X 和 Y 中樣本之間的半正矢距離。 |
|
pairwise_kernels 的有效指標。 |
|
計算 X 和 Y 之間的拉普拉斯核函數。 |
|
計算 X 和 Y 之間的線性核函數。 |
|
計算 X 和 Y 中向量之間的 L1 距離。 |
|
計算存在遺失值時的歐幾里得距離。 |
|
計算 X 和 Y 之間的成對餘弦距離。 |
|
計算 X 和 Y 之間的成對距離。 |
|
計算 X 和 Y 之間的成對歐幾里得距離。 |
|
計算 X 和 Y 之間的成對 L1 距離。 |
|
計算陣列 X 與可選陣列 Y 之間的核函數。 |
|
計算 X 和 Y 之間的多項式核函數。 |
|
計算 X 和 Y 之間的 rbf (高斯) 核函數。 |
|
計算 X 和 Y 之間的 sigmoid 核函數。 |
|
計算向量陣列 X 和可選 Y 的距離矩陣。 |
|
計算一個點與一組點之間的最小距離。 |
|
計算一個點與一組點之間的最小距離。 |
|
使用可選的縮減逐塊生成距離矩陣。 |
|
混淆矩陣視覺化。 |
|
DET 曲線視覺化。 |
|
精確度-召回率視覺化。 |
|
迴歸模型預測誤差的視覺化。 |
|
ROC 曲線視覺化。 |
|
高斯混合的變分貝氏估計。 |
|
高斯混合模型。 |
|
具有非重疊群組的 K 折疊迭代器變體。 |
|
Shuffle-Group(s)-Out 交叉驗證迭代器。 |
|
K 折疊交叉驗證器。 |
|
留一組交叉驗證器。 |
|
留一法交叉驗證器。 |
|
留 P 組交叉驗證器。 |
|
留 P 法交叉驗證器。 |
|
預定義分割交叉驗證器。 |
|
重複 K 折疊交叉驗證器。 |
|
重複分層 K 折疊交叉驗證器。 |
|
隨機排列交叉驗證器。 |
|
具有非重疊群組的分層 K 折疊迭代器變體。 |
|
分層 K 折疊交叉驗證器。 |
|
分層 ShuffleSplit 交叉驗證器。 |
|
時間序列交叉驗證器。 |
|
用於建立交叉驗證器的輸入檢查工具。 |
|
將陣列或矩陣分割成隨機訓練和測試子集。 |
|
針對估算器在指定的參數值上進行窮舉搜尋。 |
|
使用連續減半法在指定的參數值上進行搜尋。 |
|
在超參數上進行隨機搜尋。 |
|
參數網格,每個參數都具有離散數量的數值。 |
|
從給定分佈中採樣的參數產生器。 |
|
在超參數上進行隨機搜尋。 |
|
手動設定決策閾值的二元分類器。 |
|
使用交叉驗證後調整決策閾值的分類器。 |
|
為每個輸入資料點產生交叉驗證的估計值。 |
|
通過交叉驗證評估分數。 |
|
通過交叉驗證評估指標,並記錄擬合/評分時間。 |
|
學習曲線。 |
|
使用置換檢定評估交叉驗證分數的顯著性。 |
|
驗證曲線。 |
|
學習曲線視覺化。 |
|
驗證曲線視覺化。 |
|
一對一多類策略。 |
|
一對多 (OvR) 多類策略。 |
|
(錯誤校正)輸出碼多類策略。 |
|
將二元分類器排列成鏈的多標籤模型。 |
|
多目標分類。 |
|
多目標迴歸。 |
|
將迴歸模型排列成鏈的多標籤模型。 |
|
用於多變量伯努利模型的樸素貝葉斯分類器。 |
|
用於類別特徵的樸素貝葉斯分類器。 |
|
Rennie 等人 (2003) 中描述的互補樸素貝葉斯分類器。 |
|
高斯樸素貝葉斯 (GaussianNB)。 |
|
用於多項式模型的樸素貝葉斯分類器。 |
|
用於快速廣義 N 點問題的 BallTree。 |
|
用於快速廣義 N 點問題的 KDTree。 |
|
實作 k 近鄰投票的分類器。 |
|
基於 k 近鄰的迴歸。 |
|
將 X 轉換為 k 近鄰的(加權)圖形。 |
|
核密度估計。 |
|
使用局部離群因子 (LOF) 的無監督離群值檢測。 |
|
最近質心分類器。 |
|
用於實作鄰近搜尋的無監督學習器。 |
|
鄰域成分分析。 |
|
實作在給定半徑內鄰近投票的分類器。 |
|
基於固定半徑內鄰近的迴歸。 |
|
將 X 轉換為半徑小於特定值的鄰近(加權)圖形。 |
|
計算 X 中點的 k 近鄰(加權)圖形。 |
|
計算 X 中點的鄰近(加權)圖形。 |
|
排序稀疏圖,使每行都以遞增的值儲存。 |
|
伯努利受限玻爾茲曼機 (RBM)。 |
|
多層感知器分類器。 |
|
多層感知器迴歸器。 |
|
串聯多個轉換器物件的結果。 |
|
具有可選最終預測器的資料轉換器序列。 |
|
從給定的估算器建構 |
|
從給定的轉換器建構 |
|
根據閾值二值化資料(將特徵值設定為 0 或 1)。 |
|
從任意可呼叫對象建構轉換器。 |
|
將連續資料分組到間隔中。 |
|
將任意核矩陣 \(K\) 置中。 |
|
以一對多方式二值化標籤。 |
|
使用 0 到 n_classes-1 之間的值編碼目標標籤。 |
|
將每個特徵縮放到其最大絕對值。 |
|
通過將每個特徵縮放到給定範圍來轉換特徵。 |
|
在可迭代的迭代器和多標籤格式之間轉換。 |
|
將樣本單獨正規化為單位範數。 |
|
將類別特徵編碼為獨熱數值陣列。 |
|
將類別特徵編碼為整數陣列。 |
|
產生多項式和交互特徵。 |
|
逐個特徵應用冪轉換,使資料更像高斯分佈。 |
|
使用分位數資訊轉換特徵。 |
|
使用對離群值穩健的統計資訊來縮放特徵。 |
|
為特徵產生單變數 B 樣條基底。 |
|
通過移除平均值並縮放到單位變異數來標準化特徵。 |
|
用於迴歸和分類目標的目標編碼器。 |
|
使用額外的虛擬特徵來擴增資料集。 |
|
類似陣列或 scipy.sparse 矩陣的布林閾值處理。 |
|
以一對多方式二值化標籤。 |
|
將每個特徵縮放到 [-1, 1] 範圍,而不會破壞稀疏性。 |
|
通過將每個特徵縮放到給定範圍來轉換特徵。 |
|
將輸入向量個別縮放到單位範數(向量長度)。 |
|
用於使資料更像高斯分佈的參數化單調轉換。 |
|
使用分位數資訊轉換特徵。 |
|
沿著任何軸標準化資料集。 |
|
沿著任何軸標準化資料集。 |
|
透過高斯隨機投影降低維度。 |
|
透過稀疏隨機投影降低維度。 |
|
找到一個「安全」的組件數量以隨機投影到。 |
|
標籤傳播分類器。 |
|
用於半監督學習的標籤擴散模型。 |
|
自我訓練分類器。 |
|
線性支援向量分類。 |
|
線性支援向量迴歸。 |
|
Nu 支援向量分類。 |
|
Nu 支援向量迴歸。 |
|
無監督離群值檢測。 |
|
C 支援向量分類。 |
|
Epsilon 支援向量迴歸。 |
|
傳回 C 的下限。 |
|
決策樹分類器。 |
|
決策樹迴歸器。 |
|
極度隨機樹分類器。 |
|
極度隨機樹迴歸器。 |
|
以 DOT 格式匯出決策樹。 |
|
建立顯示決策樹規則的文字報告。 |
|
繪製決策樹。 |
|
將鍵值公開為屬性的容器物件。 |
|
使用索引傳回 X 的列、項目或欄位。 |
|
將類似陣列的資料轉換為浮點數陣列。 |
|
如果 X 包含 NaN 或無窮大,則拋出 ValueError。 |
|
將函數或類別標記為已棄用的裝飾器。 |
|
建立估算器的 HTML 表示法。 |
|
產生器,用於建立包含從 0 到 |
|
產生器,用於建立均勻間隔的 |
|
使陣列可索引以進行交叉驗證。 |
|
計算種子處的鍵的 32 位元 murmurhash3。 |
|
以一致的方式重新採樣陣列或稀疏矩陣。 |
|
傳回可在 X 上安全使用的遮罩。 |
|
類似陣列和稀疏矩陣的逐元素平方。 |
|
以一致的方式隨機排列陣列或稀疏矩陣。 |
|
估算器的標籤。 |
|
輸入資料的標籤。 |
|
目標資料的標籤。 |
|
分類器的標籤。 |
|
迴歸器的標籤。 |
|
轉換器的標籤。 |
|
取得估算器標籤。 |
|
標準估算器的輸入驗證。 |
|
針對陣列、清單、稀疏矩陣或類似的輸入驗證。 |
|
檢查所有陣列是否具有一致的第一維度。 |
|
將種子轉換為 np.random.RandomState 實例。 |
|
驗證純量參數類型和值。 |
|
為估算器執行 is_fitted 驗證。 |
|
檢查 |
|
確保陣列是 2D、正方形且對稱的。 |
|
攤平欄或 1d numpy 陣列,否則引發錯誤。 |
|
檢查估算器的 fit 方法是否支援給定的參數。 |
|
驗證輸入數據,並設定或檢查輸入的特徵名稱和計數。 |
|
只有在檢查返回真值時才可用的屬性。 |
|
估計不平衡數據集的類別權重。 |
|
針對不平衡數據集,按類別估計樣本權重。 |
|
檢查 |
|
判斷目標所指示的數據類型。 |
|
提取唯一的標籤的排序陣列。 |
|
計算稀疏向量的密度。 |
|
計算方陣行列式的對數。 |
|
計算一個正交矩陣,其範圍近似於 A 的範圍。 |
|
計算截斷的隨機 SVD。 |
|
正確處理稀疏矩陣情況的點積。 |
|
返回傳遞陣列中加權眾數(最常見)值的陣列。 |
|
計算 CSR 或 CSC 矩陣沿軸的增量平均值和變異數。 |
|
原地調整 CSC/CSR 矩陣的列縮放比例。 |
|
原地調整 CSR 矩陣的列縮放比例。 |
|
原地調整 CSR 或 CSC 矩陣的列縮放比例。 |
|
原地交換 CSC/CSR 矩陣的兩列。 |
|
原地交換 CSC/CSR 矩陣的兩列。 |
|
計算 CSR 或 CSC 矩陣沿軸的平均值和變異數。 |
|
原地將 CSR 矩陣或陣列的行按其 L1 範數歸一化。 |
|
原地將 CSR 矩陣或陣列的行按其 L2 範數歸一化。 |
|
返回從源點到所有可達節點的最短路徑長度。 |
|
不重複地抽取整數樣本。 |
|
查找陣列中正值的最小值。 |
|
包含消費者的中繼資料請求資訊。 |
|
儲存並處理路由器物件的中繼資料路由。 |
|
儲存路由器的呼叫者和被呼叫者方法之間的映射。 |
|
從給定物件取得 |
|
驗證並路由輸入參數。 |
|
從 |
|
從 |
|
從 |
|
檢查估計器是否符合 scikit-learn 慣例。 |
|
用於參數化估計器檢查的 Pytest 特定裝飾器。 |
|
迭代產生估計器的所有檢查可呼叫物件。 |
|
|
|
用於捕獲函式參數的裝飾器。 |
|
在 with 區塊內變更 Parallel 使用的預設後端。 |
|
註冊新的 Parallel 後端工廠。 |