binarize#

sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)[原始碼]#

將類陣列或 scipy.sparse 矩陣進行布林值閾值處理。

請在使用者指南中閱讀更多資訊。

參數:
X{類陣列, 稀疏矩陣},形狀為 (n_samples, n_features)

要逐個元素進行二元化的資料。scipy.sparse 矩陣應該是 CSR 或 CSC 格式,以避免不必要的複製。

thresholdfloat,預設值為 0.0

小於或等於此值的特徵值會被替換為 0,大於此值的則替換為 1。對於稀疏矩陣的操作,閾值可能不小於 0。

copybool,預設值為 True

如果為 False,則嘗試避免複製並就地二值化。這不保證一定能就地運作;例如,如果資料是具有 object dtype 的 NumPy 陣列,即使 copy=False,也會返回一個副本。

回傳值:
X_tr形狀為 (n_samples, n_features) 的 {ndarray, 稀疏矩陣}

轉換後的資料。

另請參閱

Binarizer

使用 Transformer API 執行二值化(例如,作為預處理 Pipeline 的一部分)。

範例

>>> from sklearn.preprocessing import binarize
>>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]]
>>> binarize(X, threshold=0.5)
array([[0., 1., 0.],
       [1., 0., 0.]])