fetch_lfw_people#

sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[來源]#

載入「野外標記人臉」(Labeled Faces in the Wild, LFW) 人臉資料集(分類)。

如有需要,會下載此資料集。

類別

5749

總樣本數

13233

維度

5828

特徵

實數,介於 0 到 255 之間

關於此資料集的使用範例,請參閱使用特徵臉和 SVM 的人臉辨識範例

請在使用者指南中閱讀更多內容。

參數:
data_home字串或路徑類,預設值為 None

指定資料集的另一個下載和快取資料夾。預設情況下,所有 scikit-learn 資料都儲存在「~/scikit_learn_data」子資料夾中。

funneled布林值,預設值為 True

下載並使用資料集的漏斗化變體 (funneled variant)。

resize浮點數或 None,預設值為 0.5

用於調整每張臉部圖片大小的比例。如果為 None,則不執行調整大小。

min_faces_per_person整數,預設值為 None

提取的資料集只會保留至少有 min_faces_per_person 張不同圖片的人的圖片。

color布林值,預設值為 False

保留 3 個 RGB 通道,而不是將它們平均為單個灰階通道。如果 color 為 True,則資料的形狀會比 color = False 的形狀多一個維度。

slice_切片元組,預設值為 (slice(70, 195), slice(78, 172))

提供自訂的 2D 切片(高度、寬度),以提取 jpeg 檔案的「感興趣」部分,並避免使用背景的統計相關性。

download_if_missing布林值,預設值為 True

如果為 False,則在資料未於本機提供時會引發 OSError,而不是嘗試從來源網站下載資料。

return_X_y布林值,預設值為 False

如果為 True,則返回 (dataset.data, dataset.target),而不是 Bunch 物件。有關 dataset.datadataset.target 物件的更多資訊,請參閱下文。

在 0.20 版本中新增。

n_retries整數,預設值為 3

遇到 HTTP 錯誤時的重試次數。

在 1.5 版本中新增。

delay浮點數,預設值為 1.0

重試之間的秒數。

在 1.5 版本中新增。

回傳值:
datasetBunch

類似字典的物件,具有下列屬性。

data形狀為 (13233, 2914) 的 numpy 陣列

每一列對應於原始大小為 62 x 47 像素的展開的人臉圖像。變更 slice_ 或 resize 參數將會變更輸出的形狀。

images形狀為 (13233, 62, 47) 的 numpy 陣列

每一列都是對應於資料集中 5749 人其中一人的臉部圖像。變更 slice_ 或 resize 參數將會變更輸出的形狀。

target形狀為 (13233,) 的 numpy 陣列

與每張臉部圖像相關聯的標籤。這些標籤的範圍為 0-5748,對應於人員 ID。

target_names形狀為 (5749,) 的 numpy 陣列

資料集中所有人員的姓名。陣列中的位置對應於目標陣列中的人員 ID。

DESCR字串

「野外標記人臉」(LFW) 資料集的描述。

(data, target)如果 return_X_y 為 True,則為元組

兩個 ndarray 的元組。第一個包含形狀為 (n_samples, n_features) 的 2D 陣列,其中每一列代表一個樣本,每一列代表特徵。第二個 ndarray 的形狀為 (n_samples,),包含目標樣本。

在 0.20 版本中新增。

範例

>>> from sklearn.datasets import fetch_lfw_people
>>> lfw_people = fetch_lfw_people()
>>> lfw_people.data.shape
(13233, 2914)
>>> lfw_people.target.shape
(13233,)
>>> for name in lfw_people.target_names[:5]:
...    print(name)
AJ Cook
AJ Lamas
Aaron Eckhart
Aaron Guiel
Aaron Patterson