sklearn.utils#

用於協助開發的各種工具。

開發者指南。 請參閱開發人員工具章節以取得更多詳細資訊。

Bunch

將鍵公開為屬性的容器物件。

_safe_indexing

使用索引回傳 X 的列、項目或欄。

as_float_array

將類陣列轉換為浮點數陣列。

assert_all_finite

如果 X 包含 NaN 或無限值,則拋出 ValueError。

deprecated

用於將函式或類別標記為已棄用的裝飾器。

estimator_html_repr

建立估算器的 HTML 表示法。

gen_batches

產生器,用於從 0 到 n 建立包含 batch_size 元素的切片。

gen_even_slices

產生器,用於建立最多為 nn_packs 個均勻間隔的切片。

indexable

使陣列可索引以進行交叉驗證。

murmurhash3_32

計算鍵在 seed 的 32 位元 murmurhash3 值。

resample

以一致的方式重新取樣陣列或稀疏矩陣。

safe_mask

回傳可在 X 上安全使用的遮罩。

safe_sqr

陣列類和稀疏矩陣的元素平方。

shuffle

以一致的方式混洗陣列或稀疏矩陣。

Tags

估算器的標籤。

InputTags

輸入資料的標籤。

TargetTags

目標資料的標籤。

ClassifierTags

分類器的標籤。

RegressorTags

迴歸器的標籤。

TransformerTags

轉換器的標籤。

get_tags

取得估算器標籤。

輸入和參數驗證#

用於驗證 scikit-learn 估算器中輸入和參數的函式。

check_X_y

標準估算器的輸入驗證。

check_array

陣列、列表、稀疏矩陣或類似項的輸入驗證。

check_consistent_length

檢查所有陣列是否具有一致的第一個維度。

check_random_state

將 seed 轉換為 np.random.RandomState 實例。

check_scalar

驗證純量參數類型和值。

validation.check_is_fitted

執行估算器的 is_fitted 驗證。

validation.check_memory

檢查 memory 是否為類似 joblib.Memory。

validation.check_symmetric

確保陣列為 2D、正方形且對稱。

validation.column_or_1d

展平欄或 1 維 numpy 陣列,否則會引發錯誤。

validation.has_fit_parameter

檢查估算器的 fit 方法是否支援給定的參數。

validation.validate_data

驗證輸入資料,並設定或檢查輸入的特徵名稱和計數。

元估算器#

元估算器的工具。

metaestimators.available_if

僅當檢查回傳真值時才可用的屬性。

基於類別標籤的權重處理#

用於處理基於類別標籤的權重的工具。

class_weight.compute_class_weight

估計不平衡資料集的類別權重。

class_weight.compute_sample_weight

估計不平衡資料集的類別樣本權重。

處理分類器中的多類目標#

用於處理分類器中多類/多輸出目標的工具。

multiclass.is_multilabel

檢查 y 是否為多標籤格式。

multiclass.type_of_target

判斷目標指示的資料類型。

multiclass.unique_labels

擷取唯一標籤的排序陣列。

最佳數學運算#

用於在 scikit-learn 中執行最佳數學運算的工具。

extmath.density

計算稀疏向量的密度。

extmath.fast_logdet

計算平方矩陣行列式的對數。

extmath.randomized_range_finder

計算其範圍近似 A 範圍的正交矩陣。

extmath.randomized_svd

計算截斷的隨機 SVD。

extmath.safe_sparse_dot

正確處理稀疏矩陣情況的點積。

extmath.weighted_mode

回傳傳遞陣列中加權眾數(最常見)值的陣列。

使用稀疏矩陣和陣列#

用於處理稀疏矩陣和陣列的工具集合。

sparsefuncs.incr_mean_variance_axis

計算 CSR 或 CSC 矩陣沿軸的增量平均值和變異數。

sparsefuncs.inplace_column_scale

CSC/CSR 矩陣的原位欄縮放。

sparsefuncs.inplace_csr_column_scale

CSR 矩陣的原位欄縮放。

sparsefuncs.inplace_row_scale

CSR 或 CSC 矩陣的原位列縮放。

sparsefuncs.inplace_swap_column

原地交換 CSC/CSR 矩陣的兩列。

sparsefuncs.inplace_swap_row

原地交換 CSC/CSR 矩陣的兩列。

sparsefuncs.mean_variance_axis

計算 CSR 或 CSC 矩陣沿軸的平均值和變異數。

用於處理以 Cython 撰寫的稀疏矩陣和陣列的工具。

sparsefuncs_fast.inplace_csr_row_normalize_l1

透過 L1 範數原地正規化 CSR 矩陣或陣列的列。

sparsefuncs_fast.inplace_csr_row_normalize_l2

透過 L2 範數原地正規化 CSR 矩陣或陣列的列。

使用圖形#

圖形工具和演算法。

graph.single_source_shortest_path_length

回傳從來源到所有可達節點的最短路徑長度。

隨機取樣#

用於隨機取樣的工具。

random.sample_without_replacement

在不重複的情況下取樣整數。

對陣列進行操作的輔助函式#

對陣列進行操作的小型輔助函式集合。

arrayfuncs.min_pos

尋找陣列在正值上的最小值。

中繼資料路由#

用於在 scikit-learn 估算器中路由中繼資料的工具。

使用者指南。 請參閱中繼資料路由章節以取得更多詳細資訊。

metadata_routing.MetadataRequest

包含使用者的中繼資料請求資訊。

metadata_routing.MetadataRouter

儲存並處理路由器物件的中繼資料路由。

metadata_routing.MethodMapping

儲存路由器的呼叫者和被呼叫者方法之間的對應關係。

metadata_routing.get_routing_for_object

從給定物件取得 Metadata{Router, Request} 實例。

metadata_routing.process_routing

驗證並路由輸入參數。

探索 scikit-learn 物件#

用於探索 scikit-learn 物件的工具。

discovery.all_displays

sklearn 取得所有顯示的列表。

discovery.all_estimators

sklearn 取得所有估算器的列表。

discovery.all_functions

取得 sklearn 中所有函式的列表。

API 相容性檢查器#

用於檢查估計器與 scikit-learn API 相容性的各種工具。

estimator_checks.check_estimator

檢查估計器是否符合 scikit-learn 慣例。

estimator_checks.parametrize_with_checks

用於參數化估計器檢查的 Pytest 特定裝飾器。

estimator_checks.estimator_checks_generator

迭代地為估計器產生所有檢查的可調用物件。

平行運算#

為 scikit-learn 使用而客製化的 joblibthreadpoolctl 工具。

parallel.Parallel

調整 joblib.Parallel 以傳播 scikit-learn 的配置。

parallel.delayed

用於捕捉函式參數的裝飾器。