make_checkerboard#
- sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[原始碼]#
為雙向分群產生具有區塊棋盤結構的陣列。
更多資訊請參閱 使用者指南。
- 參數:
- shapetuple,形狀為 (n_rows, n_cols)
結果的形狀。
- n_clustersint 或類陣列,或形狀為 (n_row_clusters, n_column_clusters)
列和欄叢集的數量。
- noisefloat,預設值為 0.0
高斯雜訊的標準差。
- minvalfloat,預設值為 10
雙向叢集的最小值。
- maxvalfloat,預設值為 100
雙向叢集的最大值。
- shufflebool,預設值為 True
隨機打亂樣本。
- random_stateint、RandomState 實例或 None,預設值為 None
決定資料集建立的隨機數字產生。傳遞 int 以便在多次函數呼叫中產生可重現的輸出。請參閱 詞彙表。
- 回傳值:
- Xndarray,形狀為
shape
產生的陣列。
- rowsndarray,形狀為 (n_clusters, X.shape[0])
每個列的叢集成員指標。
- colsndarray,形狀為 (n_clusters, X.shape[1])
每個欄的叢集成員指標。
- Xndarray,形狀為
另請參閱
make_biclusters
為雙向分群產生具有恆定區塊對角結構的陣列。
參考文獻
[1]Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.
範例
>>> from sklearn.datasets import make_checkerboard >>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10, ... random_state=42) >>> data.shape (300, 300) >>> rows.shape (100, 300) >>> columns.shape (100, 300) >>> print(rows[0][:5], columns[0][:5]) [False False False True False] [False False False False False]