binarize#
- sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)[原始碼]#
將類陣列或 scipy.sparse 矩陣進行布林值閾值處理。
請在使用者指南中閱讀更多資訊。
- 參數:
- X{類陣列, 稀疏矩陣},形狀為 (n_samples, n_features)
要逐個元素進行二元化的資料。scipy.sparse 矩陣應該是 CSR 或 CSC 格式,以避免不必要的複製。
- thresholdfloat,預設值為 0.0
小於或等於此值的特徵值會被替換為 0,大於此值的則替換為 1。對於稀疏矩陣的操作,閾值可能不小於 0。
- copybool,預設值為 True
如果為 False,則嘗試避免複製並就地二值化。這不保證一定能就地運作;例如,如果資料是具有 object dtype 的 NumPy 陣列,即使 copy=False,也會返回一個副本。
- 回傳值:
- X_tr形狀為 (n_samples, n_features) 的 {ndarray, 稀疏矩陣}
轉換後的資料。
範例
>>> from sklearn.preprocessing import binarize >>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]] >>> binarize(X, threshold=0.5) array([[0., 1., 0.], [1., 0., 0.]])