載入糖尿病數據集#

sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)[原始碼]#

載入並返回糖尿病數據集 (迴歸)。

樣本總數

442

維度

10

特徵

實數, -.2 < x < .2

目標

整數 25 - 346

注意

每個特徵的含義 (即 feature_names) 可能不明確 (尤其是對於 ltg),因為原始數據集的文檔沒有明確說明。我們在此研究領域中提供與科學文獻似乎正確的資訊。

請在使用者指南中閱讀更多資訊。

參數:
return_X_ybool, 預設值=False

如果為 True,則返回 (資料, 目標),而不是 Bunch 物件。請參閱下方以取得關於 資料目標 物件的更多資訊。

在版本 0.18 中新增。

as_framebool, 預設值=False

如果為 True,則資料為包含適當 dtype (數值) 欄的 pandas DataFrame。目標為 pandas DataFrame 或 Series,取決於目標欄的數量。如果 return_X_y 為 True,則 (資料, 目標) 將為 pandas DataFrame 或 Series,如下所述。

在版本 0.23 中新增。

scaledbool, 預設值=True

如果為 True,則特徵變數會以均值為中心,並通過標準差乘以 n_samples 的平方根進行縮放。如果為 False,則會為特徵變數返回原始資料。

在版本 1.1 中新增。

返回:
資料Bunch

類似字典的物件,具有以下屬性。

資料{ndarray, dataframe} 形狀為 (442, 10)

資料矩陣。如果 as_frame=True,則 資料 將為 pandas DataFrame。

目標: {ndarray, Series} 形狀為 (442,)

迴歸目標。如果 as_frame=True,則 目標 將為 pandas Series。

特徵名稱: list

數據集欄的名稱。

框架: DataFrame 形狀為 (442, 11)

僅在 as_frame=True 時存在。具有 資料目標 的 DataFrame。

在版本 0.23 中新增。

DESCR: str

數據集的完整描述。

data_filename: str

資料位置的路徑。

target_filename: str

目標位置的路徑。

(資料, 目標)如果 return_X_y 為 True,則為元組

返回兩個形狀為 (n_samples, n_features) 的 ndarray 元組。一個 2D 陣列,其中每一列代表一個樣本,而每一行代表給定樣本的特徵和/或目標。

在版本 0.18 中新增。

範例

>>> from sklearn.datasets import load_diabetes
>>> diabetes = load_diabetes()
>>> diabetes.target[:3]
array([151.,  75., 141.])
>>> diabetes.data.shape
(442, 10)