fetch_olivetti_faces#

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[來源]#

從 AT&T 載入 Olivetti 人臉資料集(分類)。

如有必要,請下載。

類別

40

總樣本數

400

維度

4096

特徵

實數,介於 0 和 1 之間

使用者指南中閱讀更多內容。

參數:
data_homestr 或類路徑,預設值=None

指定資料集的另一個下載和快取資料夾。預設情況下,所有 scikit-learn 資料都儲存在「~/scikit_learn_data」子資料夾中。

shufflebool,預設值=False

如果為 True,則會對資料集的順序進行洗牌,以避免將同一個人的圖像分組。

random_stateint、RandomState 實例或 None,預設值=0

決定資料集洗牌的隨機數生成。傳遞一個 int,以便在多個函式呼叫之間產生可重複的輸出。請參閱詞彙表

download_if_missingbool,預設值=True

如果為 False,當資料在本機上不可用時,則會引發 OSError,而不是嘗試從來源網站下載資料。

return_X_ybool,預設值=False

如果為 True,則傳回 (data, target) 而不是 Bunch 物件。請參閱以下有關 datatarget 物件的更多資訊。

在 0.22 版本中新增。

n_retriesint,預設值=3

遇到 HTTP 錯誤時的重試次數。

在 1.5 版本中新增。

delayfloat,預設值=1.0

重試之間的秒數。

在 1.5 版本中新增。

傳回值:
dataBunch

類似字典的物件,具有以下屬性。

data: ndarray,形狀 (400, 4096)

每一列對應於原始大小為 64 x 64 像素的展開人臉圖像。

imagesndarray,形狀 (400, 64, 64)

每一列都是一張人臉圖像,對應於資料集的 40 個受試者之一。

targetndarray,形狀 (400,)

與每個人臉圖像相關聯的標籤。這些標籤的範圍為 0-39,對應於受試者 ID。

DESCRstr

修改過的 Olivetti 人臉資料集描述。

(data, target)如果 return_X_y=True,則為元組

包含上述 datatarget 物件的元組。

在 0.22 版本中新增。

範例

>>> from sklearn.datasets import fetch_olivetti_faces
>>> olivetti_faces = fetch_olivetti_faces()
>>> olivetti_faces.data.shape
(400, 4096)
>>> olivetti_faces.target.shape
(400,)
>>> olivetti_faces.images.shape
(400, 64, 64)