sklearn.datasets#

用來載入常用數據集和人工數據產生器的工具。

使用者指南。 請參閱數據集載入工具章節以獲取更多詳細資訊。

載入器#

clear_data_home

刪除資料主目錄快取的所有內容。

dump_svmlight_file

以 svmlight / libsvm 檔案格式傾印數據集。

fetch_20newsgroups

從 20 個新聞群組數據集 (分類) 載入檔案名稱和資料。

fetch_20newsgroups_vectorized

載入並向量化 20 個新聞群組數據集 (分類)。

fetch_california_housing

載入加州房屋數據集 (迴歸)。

fetch_covtype

載入 covertype 數據集 (分類)。

fetch_file

如果本機資料夾中還不存在,則從網路上擷取檔案。

fetch_kddcup99

載入 kddcup99 數據集 (分類)。

fetch_lfw_pairs

載入 Labeled Faces in the Wild (LFW) 配對數據集 (分類)。

fetch_lfw_people

載入 Labeled Faces in the Wild (LFW) 人物數據集 (分類)。

fetch_olivetti_faces

從 AT&T 載入 Olivetti 人臉數據集 (分類)。

fetch_openml

依名稱或數據集 ID 從 openml 擷取數據集。

fetch_rcv1

載入 RCV1 多標籤數據集 (分類)。

fetch_species_distributions

用於菲利浦等人物種分佈數據集的載入器。

get_data_home

傳回 scikit-learn 資料目錄的路徑。

load_breast_cancer

載入並傳回乳腺癌威斯康辛數據集 (分類)。

load_diabetes

載入並傳回糖尿病數據集 (迴歸)。

load_digits

載入並傳回數字數據集 (分類)。

load_files

載入具有類別作為子資料夾名稱的文字檔案。

load_iris

載入並傳回鳶尾花數據集 (分類)。

load_linnerud

載入並傳回體能運動 Linnerud 數據集。

load_sample_image

載入單個樣本影像的 numpy 陣列。

load_sample_images

載入用於影像操作的範例影像。

load_svmlight_file

將 svmlight / libsvm 格式的數據集載入稀疏 CSR 矩陣。

load_svmlight_files

從 SVMlight 格式的多個檔案載入數據集。

load_wine

載入並傳回葡萄酒數據集 (分類)。

範例產生器#

make_biclusters

產生用於雙聚類的常數區塊對角結構陣列。

make_blobs

產生用於聚類的各向同性高斯 blob。

make_checkerboard

產生具有用於雙聚類的區塊棋盤結構的陣列。

make_circles

在 2D 中建立一個包含較小圓形的大圓形。

make_classification

產生隨機 n 類分類問題。

make_friedman1

產生「Friedman #1」迴歸問題。

make_friedman2

產生「Friedman #2」迴歸問題。

make_friedman3

產生「Friedman #3」迴歸問題。

make_gaussian_quantiles

產生各向同性高斯並依分位數標記樣本。

make_hastie_10_2

產生用於 Hastie 等人 2009 年範例 10.2 中使用的二元分類資料。

make_low_rank_matrix

產生具有鐘形奇異值的絕大部分低秩矩陣。

make_moons

建立兩個交錯的半圓。

make_multilabel_classification

產生隨機多標籤分類問題。

make_regression

產生隨機迴歸問題。

make_s_curve

產生 S 曲線數據集。

make_sparse_coded_signal

產生訊號作為字典元素的稀疏組合。

make_sparse_spd_matrix

產生稀疏對稱確定正矩陣。

make_sparse_uncorrelated

產生具有稀疏不相關設計的隨機迴歸問題。

make_spd_matrix

產生隨機對稱正定矩陣。

make_swiss_roll

產生瑞士捲數據集。