LabelEncoder#
- class sklearn.preprocessing.LabelEncoder[原始碼]#
使用介於 0 和 n_classes-1 之間的值編碼目標標籤。
此轉換器應用於編碼目標值,即
y
,而不是輸入X
。請在使用者指南中閱讀更多資訊。
在 0.12 版本中新增。
- 屬性:
- classes_形狀為 (n_classes,) 的 ndarray
保存每個類別的標籤。
另請參閱
OrdinalEncoder
使用序數編碼方案編碼類別特徵。
OneHotEncoder
將類別特徵編碼為 one-hot 數值陣列。
範例
LabelEncoder
可以用於正規化標籤。>>> from sklearn.preprocessing import LabelEncoder >>> le = LabelEncoder() >>> le.fit([1, 2, 2, 6]) LabelEncoder() >>> le.classes_ array([1, 2, 6]) >>> le.transform([1, 1, 2, 6]) array([0, 0, 1, 2]...) >>> le.inverse_transform([0, 0, 1, 2]) array([1, 1, 2, 6])
它也可以用於將非數值標籤(只要它們是可雜湊且可比較的)轉換為數值標籤。
>>> le = LabelEncoder() >>> le.fit(["paris", "paris", "tokyo", "amsterdam"]) LabelEncoder() >>> list(le.classes_) [np.str_('amsterdam'), np.str_('paris'), np.str_('tokyo')] >>> le.transform(["tokyo", "tokyo", "paris"]) array([2, 2, 1]...) >>> list(le.inverse_transform([2, 2, 1])) [np.str_('tokyo'), np.str_('tokyo'), np.str_('paris')]
- fit_transform(y)[原始碼]#
擬合標籤編碼器並返回編碼的標籤。
- 參數:
- y形狀為 (n_samples,) 的類陣列
目標值。
- 返回:
- y形狀為 (n_samples,) 的類陣列
編碼的標籤。
- get_metadata_routing()[原始碼]#
獲取此物件的中繼資料路由。
請查看使用者指南,瞭解路由機制如何運作。
- 返回:
- routingMetadataRequest
封裝路由資訊的
MetadataRequest
。
- get_params(deep=True)[原始碼]#
取得此估算器的參數。
- 參數:
- deepbool,預設值為 True
如果為 True,將返回此估算器和包含為估算器的子物件的參數。
- 返回:
- paramsdict
參數名稱對應到它們的值。
- inverse_transform(y)[原始碼]#
將標籤轉換回原始編碼。
- 參數:
- y形狀為 (n_samples,) 的類陣列
目標值。
- 返回:
- y形狀為 (n_samples,) 的 ndarray
原始編碼。
- set_output(*, transform=None)[原始碼]#
設定輸出容器。
請參閱「導入 set_output API」,以取得如何使用 API 的範例。
- 參數:
- transform{“default”, “pandas”, “polars”}, 預設值為 None
設定
transform
和fit_transform
的輸出。"default"
:轉換器的預設輸出格式"pandas"
:DataFrame 輸出"polars"
:Polars 輸出None
:轉換設定保持不變
在 1.4 版本中新增:新增了
"polars"
選項。
- 返回:
- self估算器實例
估算器實例。