make_checkerboard#

sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[原始碼]#

為雙向分群產生具有區塊棋盤結構的陣列。

更多資訊請參閱使用者指南。

參數:

shapetuple，形狀為 (n_rows, n_cols): 結果的形狀。
n_clustersint 或類陣列，或形狀為 (n_row_clusters, n_column_clusters): 列和欄叢集的數量。
noisefloat，預設值為 0.0: 高斯雜訊的標準差。
minvalfloat，預設值為 10: 雙向叢集的最小值。
maxvalfloat，預設值為 100: 雙向叢集的最大值。
shufflebool，預設值為 True: 隨機打亂樣本。
random_stateint、RandomState 實例或 None，預設值為 None: 決定資料集建立的隨機數字產生。傳遞 int 以便在多次函數呼叫中產生可重現的輸出。請參閱詞彙表。

回傳值:

Xndarray，形狀為 shape: 產生的陣列。
rowsndarray，形狀為 (n_clusters, X.shape[0]): 每個列的叢集成員指標。
colsndarray，形狀為 (n_clusters, X.shape[1]): 每個欄的叢集成員指標。

另請參閱

make_biclusters: 為雙向分群產生具有恆定區塊對角結構的陣列。

參考文獻

[1]

Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.

範例

>>> from sklearn.datasets import make_checkerboard
>>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10,
...                                         random_state=42)
>>> data.shape
(300, 300)
>>> rows.shape
(100, 300)
>>> columns.shape
(100, 300)
>>> print(rows[0][:5], columns[0][:5])
[False False False  True False] [False False False False False]

範例展示#

譜雙向分群演算法的示範