載入糖尿病數據集#
- sklearn.datasets.load_diabetes(*, return_X_y=False, as_frame=False, scaled=True)[原始碼]#
載入並返回糖尿病數據集 (迴歸)。
樣本總數
442
維度
10
特徵
實數, -.2 < x < .2
目標
整數 25 - 346
注意
每個特徵的含義 (即
feature_names
) 可能不明確 (尤其是對於ltg
),因為原始數據集的文檔沒有明確說明。我們在此研究領域中提供與科學文獻似乎正確的資訊。請在使用者指南中閱讀更多資訊。
- 參數:
- return_X_ybool, 預設值=False
如果為 True,則返回
(資料, 目標)
,而不是 Bunch 物件。請參閱下方以取得關於資料
和目標
物件的更多資訊。在版本 0.18 中新增。
- as_framebool, 預設值=False
如果為 True,則資料為包含適當 dtype (數值) 欄的 pandas DataFrame。目標為 pandas DataFrame 或 Series,取決於目標欄的數量。如果
return_X_y
為 True,則 (資料
,目標
) 將為 pandas DataFrame 或 Series,如下所述。在版本 0.23 中新增。
- scaledbool, 預設值=True
如果為 True,則特徵變數會以均值為中心,並通過標準差乘以
n_samples
的平方根進行縮放。如果為 False,則會為特徵變數返回原始資料。在版本 1.1 中新增。
- 返回:
- 資料
Bunch
類似字典的物件,具有以下屬性。
- 資料{ndarray, dataframe} 形狀為 (442, 10)
資料矩陣。如果
as_frame=True
,則資料
將為 pandas DataFrame。- 目標: {ndarray, Series} 形狀為 (442,)
迴歸目標。如果
as_frame=True
,則目標
將為 pandas Series。- 特徵名稱: list
數據集欄的名稱。
- 框架: DataFrame 形狀為 (442, 11)
僅在
as_frame=True
時存在。具有資料
和目標
的 DataFrame。在版本 0.23 中新增。
- DESCR: str
數據集的完整描述。
- data_filename: str
資料位置的路徑。
- target_filename: str
目標位置的路徑。
- (資料, 目標)如果
return_X_y
為 True,則為元組 返回兩個形狀為 (n_samples, n_features) 的 ndarray 元組。一個 2D 陣列,其中每一列代表一個樣本,而每一行代表給定樣本的特徵和/或目標。
在版本 0.18 中新增。
- 資料
範例
>>> from sklearn.datasets import load_diabetes >>> diabetes = load_diabetes() >>> diabetes.target[:3] array([151., 75., 141.]) >>> diabetes.data.shape (442, 10)