fetch_olivetti_faces#
- sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[來源]#
從 AT&T 載入 Olivetti 人臉資料集(分類)。
如有必要,請下載。
類別
40
總樣本數
400
維度
4096
特徵
實數,介於 0 和 1 之間
在使用者指南中閱讀更多內容。
- 參數:
- data_homestr 或類路徑,預設值=None
指定資料集的另一個下載和快取資料夾。預設情況下,所有 scikit-learn 資料都儲存在「~/scikit_learn_data」子資料夾中。
- shufflebool,預設值=False
如果為 True,則會對資料集的順序進行洗牌,以避免將同一個人的圖像分組。
- random_stateint、RandomState 實例或 None,預設值=0
決定資料集洗牌的隨機數生成。傳遞一個 int,以便在多個函式呼叫之間產生可重複的輸出。請參閱詞彙表。
- download_if_missingbool,預設值=True
如果為 False,當資料在本機上不可用時,則會引發 OSError,而不是嘗試從來源網站下載資料。
- return_X_ybool,預設值=False
如果為 True,則傳回
(data, target)
而不是Bunch
物件。請參閱以下有關data
和target
物件的更多資訊。在 0.22 版本中新增。
- n_retriesint,預設值=3
遇到 HTTP 錯誤時的重試次數。
在 1.5 版本中新增。
- delayfloat,預設值=1.0
重試之間的秒數。
在 1.5 版本中新增。
- 傳回值:
- data
Bunch
類似字典的物件,具有以下屬性。
- data: ndarray,形狀 (400, 4096)
每一列對應於原始大小為 64 x 64 像素的展開人臉圖像。
- imagesndarray,形狀 (400, 64, 64)
每一列都是一張人臉圖像,對應於資料集的 40 個受試者之一。
- targetndarray,形狀 (400,)
與每個人臉圖像相關聯的標籤。這些標籤的範圍為 0-39,對應於受試者 ID。
- DESCRstr
修改過的 Olivetti 人臉資料集描述。
- (data, target)如果
return_X_y=True
,則為元組 包含上述
data
和target
物件的元組。在 0.22 版本中新增。
- data
範例
>>> from sklearn.datasets import fetch_olivetti_faces >>> olivetti_faces = fetch_olivetti_faces() >>> olivetti_faces.data.shape (400, 4096) >>> olivetti_faces.target.shape (400,) >>> olivetti_faces.images.shape (400, 64, 64)