make_checkerboard#

sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[原始碼]#

為雙向分群產生具有區塊棋盤結構的陣列。

更多資訊請參閱 使用者指南

參數:
shapetuple,形狀為 (n_rows, n_cols)

結果的形狀。

n_clustersint 或類陣列,或形狀為 (n_row_clusters, n_column_clusters)

列和欄叢集的數量。

noisefloat,預設值為 0.0

高斯雜訊的標準差。

minvalfloat,預設值為 10

雙向叢集的最小值。

maxvalfloat,預設值為 100

雙向叢集的最大值。

shufflebool,預設值為 True

隨機打亂樣本。

random_stateint、RandomState 實例或 None,預設值為 None

決定資料集建立的隨機數字產生。傳遞 int 以便在多次函數呼叫中產生可重現的輸出。請參閱 詞彙表

回傳值:
Xndarray,形狀為 shape

產生的陣列。

rowsndarray,形狀為 (n_clusters, X.shape[0])

每個列的叢集成員指標。

colsndarray,形狀為 (n_clusters, X.shape[1])

每個欄的叢集成員指標。

另請參閱

make_biclusters

為雙向分群產生具有恆定區塊對角結構的陣列。

參考文獻

[1]

Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.

範例

>>> from sklearn.datasets import make_checkerboard
>>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10,
...                                         random_state=42)
>>> data.shape
(300, 300)
>>> rows.shape
(100, 300)
>>> columns.shape
(100, 300)
>>> print(rows[0][:5], columns[0][:5])
[False False False  True False] [False False False False False]