sklearn.feature_extraction#

從原始資料中提取特徵。

使用者指南。請參閱特徵提取章節以取得更多詳細資訊。

DictVectorizer

將特徵值映射列表轉換為向量。

FeatureHasher

實作特徵雜湊,又稱為雜湊技巧。

從圖像中提取#

從圖像提取特徵的工具。

image.PatchExtractor

從一組圖像中提取圖塊。

image.extract_patches_2d

將 2D 圖像重塑為圖塊集合。

image.grid_to_graph

像素到像素連接的圖形。

image.img_to_graph

像素到像素梯度連接的圖形。

image.reconstruct_from_patches_2d

從所有圖塊重建圖像。

從文字中提取#

從文字文件建立特徵向量的工具。

text.CountVectorizer

將文字文件集合轉換為詞符計數矩陣。

text.HashingVectorizer

將文字文件集合轉換為詞符出現次數矩陣。

text.TfidfTransformer

將計數矩陣轉換為正規化 tf 或 tf-idf 表示。

text.TfidfVectorizer

將原始文件集合轉換為 TF-IDF 特徵矩陣。