fetch_lfw_people#
- sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[來源]#
載入「野外標記人臉」(Labeled Faces in the Wild, LFW) 人臉資料集(分類)。
如有需要,會下載此資料集。
類別
5749
總樣本數
13233
維度
5828
特徵
實數,介於 0 到 255 之間
關於此資料集的使用範例,請參閱使用特徵臉和 SVM 的人臉辨識範例。
請在使用者指南中閱讀更多內容。
- 參數:
- data_home字串或路徑類,預設值為 None
指定資料集的另一個下載和快取資料夾。預設情況下,所有 scikit-learn 資料都儲存在「~/scikit_learn_data」子資料夾中。
- funneled布林值,預設值為 True
下載並使用資料集的漏斗化變體 (funneled variant)。
- resize浮點數或 None,預設值為 0.5
用於調整每張臉部圖片大小的比例。如果為
None
,則不執行調整大小。- min_faces_per_person整數,預設值為 None
提取的資料集只會保留至少有
min_faces_per_person
張不同圖片的人的圖片。- color布林值,預設值為 False
保留 3 個 RGB 通道,而不是將它們平均為單個灰階通道。如果 color 為 True,則資料的形狀會比 color = False 的形狀多一個維度。
- slice_切片元組,預設值為 (slice(70, 195), slice(78, 172))
提供自訂的 2D 切片(高度、寬度),以提取 jpeg 檔案的「感興趣」部分,並避免使用背景的統計相關性。
- download_if_missing布林值,預設值為 True
如果為 False,則在資料未於本機提供時會引發 OSError,而不是嘗試從來源網站下載資料。
- return_X_y布林值,預設值為 False
如果為 True,則返回
(dataset.data, dataset.target)
,而不是 Bunch 物件。有關dataset.data
和dataset.target
物件的更多資訊,請參閱下文。在 0.20 版本中新增。
- n_retries整數,預設值為 3
遇到 HTTP 錯誤時的重試次數。
在 1.5 版本中新增。
- delay浮點數,預設值為 1.0
重試之間的秒數。
在 1.5 版本中新增。
- 回傳值:
- dataset
Bunch
類似字典的物件,具有下列屬性。
- data形狀為 (13233, 2914) 的 numpy 陣列
每一列對應於原始大小為 62 x 47 像素的展開的人臉圖像。變更
slice_
或 resize 參數將會變更輸出的形狀。- images形狀為 (13233, 62, 47) 的 numpy 陣列
每一列都是對應於資料集中 5749 人其中一人的臉部圖像。變更
slice_
或 resize 參數將會變更輸出的形狀。- target形狀為 (13233,) 的 numpy 陣列
與每張臉部圖像相關聯的標籤。這些標籤的範圍為 0-5748,對應於人員 ID。
- target_names形狀為 (5749,) 的 numpy 陣列
資料集中所有人員的姓名。陣列中的位置對應於目標陣列中的人員 ID。
- DESCR字串
「野外標記人臉」(LFW) 資料集的描述。
- (data, target)如果
return_X_y
為 True,則為元組 兩個 ndarray 的元組。第一個包含形狀為 (n_samples, n_features) 的 2D 陣列,其中每一列代表一個樣本,每一列代表特徵。第二個 ndarray 的形狀為 (n_samples,),包含目標樣本。
在 0.20 版本中新增。
- dataset
範例
>>> from sklearn.datasets import fetch_lfw_people >>> lfw_people = fetch_lfw_people() >>> lfw_people.data.shape (13233, 2914) >>> lfw_people.target.shape (13233,) >>> for name in lfw_people.target_names[:5]: ... print(name) AJ Cook AJ Lamas Aaron Eckhart Aaron Guiel Aaron Patterson