load_wine#

sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)[原始碼]#

載入並回傳葡萄酒資料集(分類)。

版本 0.18 新增。

葡萄酒資料集是一個經典且非常簡單的多類別分類資料集。

類別

3

每個類別的樣本數

[59,71,48]

樣本總數

178

維度

13

特徵

實數,正數

UCI ML 葡萄酒資料集副本已下載並修改為符合標準格式,來源:https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data

請參閱使用者指南以瞭解更多資訊。

參數:
return_X_ybool,預設值為 False

如果為 True,則回傳 (資料, 目標) 而非 Bunch 物件。請參閱下文以瞭解有關 資料目標 物件的更多資訊。

as_framebool,預設值為 False

如果為 True,則資料為 pandas DataFrame,其中包含具有適當 dtype(數值)的欄位。目標是 pandas DataFrame 或 Series,取決於目標欄位的數量。如果 return_X_y 為 True,則(資料目標)將會是 pandas DataFrame 或 Series,如下所述。

版本 0.23 新增。

回傳值:
dataBunch

類似字典的物件,具有以下屬性。

data{ndarray, dataframe},形狀為 (178, 13)

資料矩陣。如果 as_frame=True,則 data 將會是 pandas DataFrame。

target: {ndarray, Series},形狀為 (178,)

分類目標。如果 as_frame=True,則 target 將會是 pandas Series。

feature_names: list

資料集欄位的名稱。

target_names: list

目標類別的名稱。

frame: DataFrame,形狀為 (178, 14)

僅當 as_frame=True 時存在。具有 datatarget 的 DataFrame。

版本 0.23 新增。

DESCR: str

資料集的完整描述。

(data, target)如果 return_X_y 為 True,則為元組

預設情況下為兩個 ndarray 的元組。第一個包含形狀為 (178, 13) 的 2D 陣列,其中每一列代表一個樣本,每一欄代表特徵。第二個形狀為 (178,) 的陣列包含目標樣本。

範例

假設您對樣本 10、80 和 140 感興趣,並想知道它們的類別名稱。

>>> from sklearn.datasets import load_wine
>>> data = load_wine()
>>> data.target[[10, 80, 140]]
array([0, 1, 2])
>>> list(data.target_names)
[np.str_('class_0'), np.str_('class_1'), np.str_('class_2')]