轉換器混合#

class sklearn.base.TransformerMixin[來源]#

scikit-learn 中所有轉換器的混合類。

此混合類定義以下功能

  • 一個 fit_transform 方法,委託給 fittransform

  • 一個 set_output 方法,將 X 輸出為特定的容器類型。

如果定義了 get_feature_names_out,則 BaseEstimator 將自動包裝 transformfit_transform 以遵循 set_output API。有關詳細資訊,請參閱 set_output 的開發人員 API

OneToOneFeatureMixinClassNamePrefixFeaturesOutMixin 是用於定義 get_feature_names_out 的實用 mixin。

範例

>>> import numpy as np
>>> from sklearn.base import BaseEstimator, TransformerMixin
>>> class MyTransformer(TransformerMixin, BaseEstimator):
...     def __init__(self, *, param=1):
...         self.param = param
...     def fit(self, X, y=None):
...         return self
...     def transform(self, X):
...         return np.full(shape=len(X), fill_value=self.param)
>>> transformer = MyTransformer()
>>> X = [[1, 2], [2, 3], [3, 4]]
>>> transformer.fit_transform(X)
array([1, 1, 1])
fit_transform(X, y=None, **fit_params)[原始碼]#

先擬合數據,然後轉換它。

使用可選參數 fit_params 將轉換器擬合至 Xy,並返回 X 的轉換版本。

參數:
X形狀為 (n_samples, n_features) 的類陣列 (array-like)

輸入樣本。

y形狀為 (n_samples,) 或 (n_samples, n_outputs) 的類陣列 (array-like),預設值為 None

目標值 (對於無監督轉換為 None)。

**fit_params字典 (dict)

額外的擬合參數。

返回:
X_new形狀為 (n_samples, n_features_new) 的 ndarray 陣列

轉換後的陣列。

set_output(*, transform=None)[原始碼]#

設定輸出容器。

請參閱 介紹 set_output API 以獲取如何使用此 API 的範例。

參數:
transform{“default”, “pandas”, “polars”}, 預設值為 None

配置 transformfit_transform 的輸出。

  • "default":轉換器的預設輸出格式

  • "pandas":DataFrame 輸出

  • "polars":Polars 輸出

  • None:轉換配置未變更

在 1.4 版本中新增:新增了 "polars" 選項。

返回:
self估算器實例

估算器實例。