load_wine#

sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)[原始碼]#

載入並回傳葡萄酒資料集（分類）。

版本 0.18 新增。

葡萄酒資料集是一個經典且非常簡單的多類別分類資料集。

類別	3
每個類別的樣本數	[59,71,48]
樣本總數	178
維度	13
特徵	實數，正數

UCI ML 葡萄酒資料集副本已下載並修改為符合標準格式，來源：https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data

請參閱使用者指南以瞭解更多資訊。

參數:

return_X_ybool，預設值為 False: 如果為 True，則回傳 (資料, 目標) 而非 Bunch 物件。請參閱下文以瞭解有關 資料 和 目標 物件的更多資訊。
as_framebool，預設值為 False: 如果為 True，則資料為 pandas DataFrame，其中包含具有適當 dtype（數值）的欄位。目標是 pandas DataFrame 或 Series，取決於目標欄位的數量。如果 return_X_y 為 True，則（資料，目標）將會是 pandas DataFrame 或 Series，如下所述。

版本 0.23 新增。

回傳值:

dataBunch

類似字典的物件，具有以下屬性。

data{ndarray, dataframe}，形狀為 (178, 13): 資料矩陣。如果 as_frame=True，則 data 將會是 pandas DataFrame。
target: {ndarray, Series}，形狀為 (178,): 分類目標。如果 as_frame=True，則 target 將會是 pandas Series。
feature_names: list: 資料集欄位的名稱。
target_names: list: 目標類別的名稱。
frame: DataFrame，形狀為 (178, 14): 僅當 as_frame=True 時存在。具有 data 和 target 的 DataFrame。

版本 0.23 新增。
DESCR: str: 資料集的完整描述。

(data, target)如果 return_X_y 為 True，則為元組

預設情況下為兩個 ndarray 的元組。第一個包含形狀為 (178, 13) 的 2D 陣列，其中每一列代表一個樣本，每一欄代表特徵。第二個形狀為 (178,) 的陣列包含目標樣本。

範例

假設您對樣本 10、80 和 140 感興趣，並想知道它們的類別名稱。

>>> from sklearn.datasets import load_wine
>>> data = load_wine()
>>> data.target[[10, 80, 140]]
array([0, 1, 2])
>>> list(data.target_names)
[np.str_('class_0'), np.str_('class_1'), np.str_('class_2')]

範例展示#

真實資料集上的離群值偵測

使用視覺化 API 的 ROC 曲線

特徵縮放的重要性