load_iris#

sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False)[原始碼]#

載入並回傳鳶尾花資料集（分類）。

鳶尾花資料集是一個經典且非常容易的多類別分類資料集。

類別	3
每個類別的樣本數	50
總樣本數	150
維度	4
特徵	實數，正數

在使用者指南中閱讀更多內容。

在 0.20 版本中變更：根據 Fisher 的論文修正了兩個錯誤的資料點。新版本與 R 中的版本相同，但與 UCI 機器學習儲存庫中的版本不同。

參數:

return_X_ybool，預設值 = False: 如果為 True，則回傳 (data, target) 而非 Bunch 物件。請參閱下方關於 data 和 target 物件的更多資訊。

在 0.18 版本中新增。
as_framebool，預設值 = False: 如果為 True，則資料為 pandas DataFrame，包含具有適當 dtype (數值) 的欄位。目標是 pandas DataFrame 或 Series，取決於目標欄位的數量。如果 return_X_y 為 True，則 (data, target) 將會是 pandas DataFrames 或 Series，如下所述。

在 0.23 版本中新增。

回傳:

dataBunch

類似字典的物件，具有以下屬性。

data形狀為 (150, 4) 的 {ndarray, dataframe}: 資料矩陣。如果 as_frame=True，則 data 將會是 pandas DataFrame。
target：形狀為 (150,) 的 {ndarray, Series}: 分類目標。如果 as_frame=True，則 target 將會是 pandas Series。
feature_names：列表: 資料集欄位的名稱。
target_names：列表: 目標類別的名稱。
frame：形狀為 (150, 5) 的 DataFrame: 只有在 as_frame=True 時才會出現。包含 data 和 target 的 DataFrame。

在 0.23 版本中新增。
DESCR：字串: 資料集的完整描述。
filename：字串: 資料位置的路徑。

在 0.20 版本中新增。

(data, target)如果 return_X_y 為 True 則為元組

兩個 ndarray 的元組。第一個包含一個形狀為 (n_samples, n_features) 的 2D 陣列，每一列代表一個樣本，每一欄代表特徵。第二個 ndarray 的形狀為 (n_samples,)，包含目標樣本。

在 0.18 版本中新增。

範例

假設您對樣本 10、25 和 50 感興趣，並且想知道它們的類別名稱。

>>> from sklearn.datasets import load_iris
>>> data = load_iris()
>>> data.target[[10, 25, 50]]
array([0, 0, 1])
>>> list(data.target_names)
[np.str_('setosa'), np.str_('versicolor'), np.str_('virginica')]