版本 1.5#
如需發行版本主要重點的簡短描述,請參閱 scikit-learn 1.5 的發行重點。
變更日誌圖例
主要功能 以前無法做到的重大功能。
功能 以前無法做到的功能。
效率 現有功能現在可能不需要那麼多的計算或記憶體。
增強 各種細微的改進。
修正 之前沒有按照文件或合理預期運作的功能,現在應該可以正常運作。
API 變更 您將需要變更您的程式碼才能在未來達到相同的效果;或者某個功能將在未來被移除。
版本 1.5.2#
2024 年 9 月
影響許多模組的變更#
修正 修正
sklearn._loss
、sklearn.manifold
、sklearn.metrics
和sklearn.utils
中一些未支援 OpenMP 建置的 Cython 模組的效能回歸。 #29694 由 Loïc Estèvce 提供。
變更日誌#
sklearn.calibration
#
修正 在
cv
中使用LeaveOneOut
時引發錯誤,符合使用KFold(n_splits=n_samples)
時的情況。 #29545 由 Lucy Liu 提供
sklearn.compose
#
修正 修正當轉換輸出設定為
pandas
或polars
時,compose.TransformedTargetRegressor
不會引發UserWarning
,因為它不是一個轉換器。#29401 由 Stefanie Senger 提供。
sklearn.decomposition
#
修正 提高
decomposition.FastICA
中whiten_solver="eigh"
的白化步驟中的秩缺失閾值,以提高估計器的平台獨立性。#29612 由 Olivier Grisel 提供。
sklearn.metrics
#
修正 修正
metrics.accuracy_score
和metrics.zero_one_loss
中的回歸問題,該問題會導致多標籤輸入的 Array API 調度產生錯誤。#29336 由 Edoardo Abati 提供。
sklearn.svm
#
修正 修正
svm.SVC
和svm.SVR
中的回歸問題,以便我們接受C=float("inf")
。#29780 由 Guillaume Lemaitre 提供。
版本 1.5.1#
2024 年 7 月
影響許多模組的變更#
修正 修正了所有估計器的輸入資料驗證中的回歸問題,當傳遞由唯讀緩衝區支援的 DataFrame 時,會引發意外錯誤。 #29018 由 Jérémie du Boisberranger 提供。
修正 修正了在某些設定中導致匯入時死鎖的回歸問題。#29235 由 Jérémie du Boisberranger 提供。
變更日誌#
sklearn.compose
#
效率 修正當
n_jobs > 1
時,compose.ColumnTransformer
中每個轉換器都會複製完整輸入資料的效能回歸問題。 #29330 由 Jérémie du Boisberranger 提供。
sklearn.metrics
#
修正 修正
metrics.r2_score
中的回歸問題。傳遞已停用 Array API 調度的 torch CPU 張量會抱怨非 CPU 裝置,而不是隱式地將這些輸入轉換為常規 NumPy 陣列。#29119 由 @Olivier Grisel 提供。修正 修正
metrics.zero_one_loss
中的回歸問題,該問題會導致多標籤輸入的 Array API 調度產生錯誤。 #29269 由 Yaroslav Korobko 提供。
sklearn.model_selection
#
修正 修正
model_selection.GridSearchCV
中具有異質參數值的參數網格的回歸問題。#29078 由 Loïc Estève 提供。修正 修正
model_selection.GridSearchCV
中具有估計器作為參數值的參數網格的回歸問題。#29179 由 Marco Gorelli 提供。修正 修正
model_selection.GridSearchCV
中,當參數網格的參數值為不同大小的陣列時,會發生的回歸錯誤。#29314,由 Marco Gorelli 貢獻。
sklearn.tree
#
修正 修正
tree.export_graphviz
和tree.plot_tree
在 32 位元作業系統上可能導致例外或錯誤結果的問題。#29327,由 Loïc Estève 貢獻。
sklearn.utils
#
API 變更
utils.validation.check_array
新增了一個參數force_writeable
,用於控制輸出陣列的可寫性。如果設定為True
,則保證輸出陣列是可寫的,並且如果輸入陣列是唯讀的,則會建立副本。如果設定為False
,則不保證輸出陣列的可寫性。#29018,由 Jérémie du Boisberranger 貢獻。
版本 1.5.0#
2024 年 5 月
安全性#
修正
feature_extraction.text.CountVectorizer
和feature_extraction.text.TfidfVectorizer
不再將訓練集中丟棄的詞彙儲存在其stop_words_
屬性中。此屬性會持有過於頻繁(高於max_df
)以及過於罕見(低於min_df
)的詞彙。這修正了一個潛在的安全性問題(資料洩漏),如果被丟棄的罕見詞彙在模型開發人員不知情的情況下,持有來自訓練集的敏感資訊。注意:建議這些類別的使用者,使用新的 scikit-learn 版本重新訓練其管線,或手動清除先前訓練的轉換器實例中的
stop_words_
屬性。此屬性僅設計用於模型檢查目的,對轉換器的行為沒有影響。#28823,由 Olivier Grisel 貢獻。
變更的模型#
效率
preprocessing.QuantileTransformer
中的子取樣對於密集陣列現在更加高效,但是擬合的分位數和transform
的結果可能與之前略有不同(保持相同的統計特性)。#27344,由 Xuefeng Xu 貢獻。增強
decomposition.PCA
、decomposition.SparsePCA
和decomposition.TruncatedSVD
現在根據元件值設定components_
屬性的符號,而不是使用轉換後的資料作為參考。此變更是必要的,以便為所有PCA
求解器(包括此版本中引入的新svd_solver="covariance_eigh"
選項)提供一致的元件符號。
影響許多模組的變更#
修正 當將 1D 稀疏陣列傳遞給期望 2D 稀疏輸入的方法時,引發帶有資訊性錯誤訊息的
ValueError
。#28988,由 Olivier Grisel 貢獻。API 變更 估算器的
inverse_transform
方法的輸入名稱已標準化為X
。因此,Xt
已被棄用,並將在版本 1.7 中從以下估算器中移除:cluster.FeatureAgglomeration
、decomposition.MiniBatchNMF
、decomposition.NMF
、model_selection.GridSearchCV
、model_selection.RandomizedSearchCV
、pipeline.Pipeline
和preprocessing.KBinsDiscretizer
。#28756,由 Will Dean 貢獻。
支援 Array API#
已更新其他估算器和函數,以包含對所有符合 Array API 的輸入的支援。
有關更多詳細資訊,請參閱 Array API 支援 (實驗性)。
函數
sklearn.metrics.r2_score
現在支援符合 Array API 的輸入。#27904,由 Eric Lindgren、Franck Charras、Olivier Grisel 和 Tim Head 貢獻。
類別
linear_model.Ridge
現在支援svd
求解器的 Array API。有關更多詳細資訊,請參閱 Array API 支援 (實驗性)。#27800,由 Franck Charras、Olivier Grisel 和 Tim Head 貢獻。
支援使用 Meson 構建#
從 scikit-learn 1.5 開始,Meson 是構建 scikit-learn 的主要支援方式,有關更多詳細資訊,請參閱 從原始碼構建。
除非發現主要的阻礙,否則將在 scikit-learn 1.6 中捨棄 setuptools 支援。1.5.x 版本將支援使用 setuptools 構建 scikit-learn。
在 #28040 中新增了 Meson 對構建 scikit-learn 的支援,由 Loïc Estève 貢獻。
中繼資料路由#
以下模型現在在其一個或多個方法中支援中繼資料路由。有關更多詳細資訊,請參閱 中繼資料路由使用者指南。
功能
impute.IterativeImputer
現在在其fit
方法中支援中繼資料路由。#28187,由 Stefanie Senger 貢獻。功能
ensemble.BaggingClassifier
和ensemble.BaggingRegressor
現在支援中繼資料路由。fit 方法現在接受**fit_params
,這些參數透過其fit
方法傳遞給底層估算器。#28432,由 Adam Li 和 Benjamin Bossan 貢獻。新功能
linear_model.RidgeCV
和linear_model.RidgeClassifierCV
現在在其fit
方法中支援元數據路由,並將元數據路由到基礎的model_selection.GridSearchCV
物件或基礎的評分器。#27560 由 Omar Salman 貢獻。新功能
GraphicalLassoCV
現在在其fit
方法中支援元數據路由,並將元數據路由到交叉驗證分割器。#27566 由 Omar Salman 貢獻。新功能
linear_model.RANSACRegressor
現在在其fit
、score
和predict
方法中支援元數據路由,並將元數據路由到其基礎估計器的fit
、score
和predict
方法。#28261 由 Stefanie Senger 貢獻。新功能
ensemble.VotingClassifier
和ensemble.VotingRegressor
現在支援元數據路由,並透過它們的fit
方法將**fit_params
傳遞給基礎的估計器。#27584 由 Stefanie Senger 貢獻。新功能
pipeline.FeatureUnion
現在在其fit
和fit_transform
方法中支援元數據路由,並將元數據路由到基礎轉換器的fit
和fit_transform
方法。#28205 由 Stefanie Senger 貢獻。修復 修復了當解析透過類別屬性設定的預設路由請求時的問題。#28435 由 Adrin Jalali 貢獻。
修復 修復了當
set_{method}_request
方法被用作未綁定方法時的問題,如果有人嘗試裝飾它們,就會發生這種情況。#28651 由 Adrin Jalali 貢獻。修復 防止當具有預設
scoring
參數 (None
) 的估計器路由元數據時出現RecursionError
。#28712 由 Stefanie Senger 貢獻。
變更日誌#
sklearn.calibration
#
修復 修復了
calibration.CalibratedClassifierCV
中的回歸問題,該問題會錯誤地針對字串目標引發錯誤。#28843 由 Jérémie du Boisberranger 貢獻。
sklearn.cluster
#
修復
cluster.MeanShift
類別現在可以針對常數數據正確收斂。#28951 由 Akihiro Kuno 貢獻。修復 在
OPTICS
的fit
方法中建立預先計算的稀疏矩陣副本,以避免就地修改稀疏矩陣。#28491 由 Thanh Lam Dang 貢獻。修復
cluster.HDBSCAN
現在當algorithm="brute"
或"auto"
時,支援sklearn.metrics.pairwise_distances
支援的所有度量。#28664 由 Manideep Yenugula 貢獻。
sklearn.compose
#
新功能 已擬合的
compose.ColumnTransformer
現在實作__getitem__
,它會依名稱傳回已擬合的轉換器。#27990 由 Thomas Fan 貢獻。增強 如果僅提供
inverse_func
而未同時明確設定func
(預設為恆等函數),compose.TransformedTargetRegressor
現在會在fit
中引發錯誤。#28483 由 Stefanie Senger 貢獻。增強
compose.ColumnTransformer
現在可以在已擬合的transformers_
屬性中,將「remainder」欄位顯示為欄位名稱或布林值遮罩,而不是欄位索引。#27657 由 Jérôme Dockès 貢獻。修復 修復了
compose.ColumnTransformer
中n_jobs > 1
的錯誤,其中間選定的欄位會以唯讀陣列的形式傳遞給轉換器。#28822 由 Jérémie du Boisberranger 貢獻。
sklearn.cross_decomposition
#
修復
cross_decomposition.PLSRegression
的coef_
已擬合屬性,現在當scale=True
時,會同時考量X
和Y
的尺度。請注意,先前的預測值不受此錯誤影響。#28612 由 Guillaume Lemaitre 貢獻。API 變更 在以下方法的 fit、transform 和 inverse_transform 中,將
Y
棄用並改用y
:cross_decomposition.PLSRegression
、cross_decomposition.PLSCanonical
、cross_decomposition.CCA
和cross_decomposition.PLSSVD
。Y
將在 1.7 版中移除。#28604 由 David Leon 貢獻。
sklearn.datasets
#
增強 為函數
datasets.fetch_20newsgroups
、datasets.fetch_20newsgroups_vectorized
、datasets.fetch_california_housing
、datasets.fetch_covtype
、datasets.fetch_kddcup99
、datasets.fetch_lfw_pairs
、datasets.fetch_lfw_people
、datasets.fetch_olivetti_faces
、datasets.fetch_rcv1
和datasets.fetch_species_distributions
新增可選參數n_retries
和delay
。預設情況下,如果發生網路故障,這些函數會最多重試 3 次。#28160 由 Zhehao Liu 和 Filip Karlo Došilović 貢獻。
sklearn.decomposition
#
效率提升
svd_solver="full"
的decomposition.PCA
現在會分配一個連續的components_
屬性,而不是奇異向量的非連續片段。當n_components << n_features
時,這可以節省一些記憶體,更重要的是,透過利用連續陣列上 BLAS GEMM 的快取局部性,可以將後續對transform
方法的呼叫速度提高一個數量級以上。#27491 由 Olivier Grisel 貢獻。增強 當
svd_solver="auto"
時,PCA
現在會自動為稀疏輸入選擇 ARPACK 求解器,而不是引發錯誤。#28498 由 Thanh Lam Dang 貢獻。增強
decomposition.PCA
現在支援一個名為svd_solver="covariance_eigh"
的新求解器選項,該選項對於具有大量資料點和少量特徵(例如,n_samples >> 1000 > n_features
)的資料集,可提供一個數量級的速度提升和減少記憶體使用量。svd_solver="auto"
選項已更新為針對此類資料集自動使用新的求解器。此求解器也接受稀疏輸入資料。#27491 由 Olivier Grisel 貢獻。修復 使用
svd_solver="arpack"
、whiten=True
和n_components
的值大於訓練集的秩的decomposition.PCA
擬合,在轉換保留資料時,不再傳回無限值。#27491 由 Olivier Grisel 貢獻。
sklearn.dummy
#
增強
dummy.DummyClassifier
和dummy.DummyRegressor
現在在fit
之後具有n_features_in_
和feature_names_in_
屬性。#27937 由 Marco vd Boom 貢獻。
sklearn.ensemble
#
效率提升 透過避免呼叫
predict_proba
,改進了ensemble.HistGradientBoostingClassifier
的predict
執行時間。#27844 由 Christian Lorentzen 貢獻。效率提升 透過在尋找分箱閾值之前對資料進行預先排序,
ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
現在快了一點。#28102 由 Christian Lorentzen 貢獻。修復 當為非類別特徵指定
monotonic_cst
時,修復了ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
中的錯誤。#28925 由 Xiao Yuan 貢獻。
sklearn.feature_extraction
#
效率提升
feature_extraction.text.TfidfTransformer
現在透過使用 NumPy 向量而不是稀疏矩陣來儲存反向文件頻率,因此速度更快且更節省記憶體。 #18843 由 Paolo Montesel 貢獻。功能增強
feature_extraction.text.TfidfTransformer
現在如果輸入矩陣的資料類型為np.float64
或np.float32
,則會保留其資料類型。#28136 由 Guillaume Lemaitre 貢獻。
sklearn.feature_selection
#
功能增強
feature_selection.mutual_info_regression
和feature_selection.mutual_info_classif
現在支援n_jobs
參數。#28085 由 Neto Menoci 和 Florin Andrei 貢獻。功能增強
feature_selection.RFECV
的cv_results_
屬性新增了一個鍵n_features
,其中包含一個陣列,記錄每個步驟所選取的特徵數量。#28670 由 Miguel Silva 貢獻。
sklearn.impute
#
功能增強
impute.SimpleImputer
現在支援透過傳遞一個函數來取代策略名稱,以實現自訂策略。#28053 由 Mark Elliot 貢獻。
sklearn.inspection
#
錯誤修正 當提供
polars.DataFrame
時,inspection.DecisionBoundaryDisplay.from_estimator
不再針對遺失的特徵名稱發出警告。#28718 由 Patrick Wang 貢獻。
sklearn.linear_model
#
功能增強 當
verbose
設定為正值時,linear_model.LogisticRegression
和linear_model.LogisticRegressionCV
中的求解器"newton-cg"
現在會發出資訊。#27526 由 Christian Lorentzen 貢獻。錯誤修正
linear_model.ElasticNet
、linear_model.ElasticNetCV
、linear_model.Lasso
和linear_model.LassoCV
現在明確不接受大型稀疏資料格式。#27576 由 Stefanie Senger 貢獻。錯誤修正 當
cv
為 None 時,linear_model.RidgeCV
和RidgeClassifierCV
現在會正確地將sample_weight
傳遞給底層的評分器。#27560 由 Omar Salman 貢獻。錯誤修正 當設定
tol
時,linear_model.OrthogonalMatchingPursuit
中的n_nonzero_coefs_
屬性現在將始終為None
,因為在此情況下會忽略n_nonzero_coefs
。#28557 由 Lucy Liu 貢獻。API 變更 當
cv != None
時,linear_model.RidgeCV
和linear_model.RidgeClassifierCV
現在將允許alpha=0
,這與linear_model.Ridge
和linear_model.RidgeClassifier
的行為一致。#28425 由 Lucy Liu 貢獻。API 變更 在
linear_model.PassiveAggressiveClassifier
、linear_model.PassiveAggressiveRegressor
、linear_model.SGDClassifier
、linear_model.SGDRegressor
和linear_model.SGDOneClassSVM
中,傳遞average=0
以停用平均已棄用。請改為傳遞average=False
。#28582 由 Jérémie du Boisberranger 貢獻。API 變更
linear_model.LogisticRegression
和linear_model.LogisticRegressionCV
中的參數multi_class
已被棄用。multi_class
將在 1.7 版本中移除,並且在內部,對於 3 個或更多類別,它將始終使用多項式。如果您仍然想使用一對多方案,可以使用OneVsRestClassifier(LogisticRegression(..))
。#28703 由 Christian Lorentzen 貢獻。API 變更 在
~linear_model.RidgeCV
和~linear_model.RidgeClassifierCV
中,store_cv_values
和cv_values_
已被棄用,改用store_cv_results
和cv_results_
。#28915 由 Lucy Liu 貢獻。
sklearn.manifold
#
API 變更 在
manifold.TSNE
中,棄用n_iter
,改用max_iter
。n_iter
將在 1.7 版本中移除。這使得manifold.TSNE
與其他估計器保持一致。 #28471 由 Lucy Liu 貢獻。
sklearn.metrics
#
新功能
metrics.pairwise_distances
也接受計算非數值陣列的成對距離。這僅透過自訂指標支援。#27456 由 Venkatachalam N、Kshitij Mathur 和 Julian Libiseller-Egger 貢獻。新功能 當
scoring
為dict
、set
、tuple
或list
時,sklearn.metrics.check_scoring
現在會傳回多指標評分器。#28360 由 Thomas Fan 貢獻。新功能 新增了
metrics.d2_log_loss_score
,用於計算對數損失的 D^2 分數。#28351 由 Omar Salman 貢獻。效率提升 提升了當指定
pos_label
參數時,以下函數的效率:brier_score_loss
、calibration_curve
、det_curve
、precision_recall_curve
、roc_curve
。同時提升了RocCurveDisplay
、PrecisionRecallDisplay
、DetCurveDisplay
、CalibrationDisplay
中from_estimator
和from_predictions
方法的效率。#28051 由 Pierre de Fréminville 貢獻。修復 當輸入為標籤的子集時,
metrics.classification_report
現在只會顯示準確度,而不是微平均。#28399 由 Vineet Joshi 貢獻。修復 修復了 Windows 上 OpenBLAS 0.3.26 在成對距離計算中出現死鎖的問題。這可能會影響基於鄰居的演算法。#28692 由 Loïc Estève 貢獻。
API 變更
metrics.precision_recall_curve
棄用了關鍵字參數probas_pred
,改用y_score
。probas_pred
將在 1.7 版本中移除。#28092 由 Adam Li 貢獻。API 變更
metrics.brier_score_loss
棄用了關鍵字參數y_prob
,改用y_proba
。y_prob
將在 1.7 版本中移除。#28092 由 Adam Li 貢獻。API 變更 對於分類器和分類指標,以位元組編碼的標籤已被棄用,並將在 v1.7 中引發錯誤。#18555 由 Kaushik Amar Das 貢獻。
sklearn.mixture
#
修復
mixture.GaussianMixture
和mixture.BayesianGaussianMixture
的converged_
屬性現在反映最佳擬合的收斂狀態,而之前如果任何擬合收斂,則該屬性為True
。#26837 由 Krsto Proroković 貢獻。
sklearn.model_selection
#
主要功能
model_selection.TunedThresholdClassifierCV
透過交叉驗證找到最大化分類指標的二元分類器的決策閾值。model_selection.FixedThresholdClassifier
則是在想要使用固定的決策閾值而不進行任何調整方案時的替代方案。#26120 由 Guillaume Lemaitre 貢獻。增強 當將群組傳遞給 split 時,忽略群組參數的 CV 分割器 現在會發出警告。#28210 由 Thomas Fan 貢獻。
增強 當
refit=True
時,GridSearchCV
、RandomizedSearchCV
、HalvingGridSearchCV
和HalvingRandomSearchCV
的 HTML 圖表表示將顯示最佳估計器。#28722 由 Yao Xiao 和 Thomas Fan 貢獻。修正
cv_results_
屬性(屬於model_selection.GridSearchCV
)現在會回傳適當 NumPy 資料型別的遮罩陣列,而不是一直回傳object
資料型別。 #28352 由 Marco Gorelli 貢獻。修正
model_selection.train_test_split
現在可與 Array API 輸入一同運作。先前索引處理不正確,導致在使用像 CuPY 這類嚴格實作 Array API 時會發生例外。 #28407 由 Tim Head 貢獻。
sklearn.multioutput
#
增強 新增
chain_method
參數至multioutput.ClassifierChain
。 #27700 由 Lucy Liu 貢獻。
sklearn.neighbors
#
修正 修正
neighbors.NeighborhoodComponentsAnalysis
,使get_feature_names_out
回傳正確的特徵名稱數量。 #28306 由 Brendan Lu 貢獻。
sklearn.pipeline
#
功能
pipeline.FeatureUnion
現在可以使用verbose_feature_names_out
屬性。如果True
,get_feature_names_out
會在所有特徵名稱前加上產生該特徵的轉換器的名稱。如果False
,get_feature_names_out
則不會在任何特徵名稱前加上前綴,且在特徵名稱不唯一時會產生錯誤。 #25991 由 Jiawei Zhang 貢獻。
sklearn.preprocessing
#
增強
preprocessing.QuantileTransformer
和preprocessing.quantile_transform
現在支援明確停用子採樣。 #27636 由 Ralph Urlus 貢獻。
sklearn.tree
#
增強 現在,透過
tree.plot_tree
在 matplotlib 中繪製樹狀圖時,會顯示「True/False」標籤,以指示樣本在給定分割條件下的遍歷方向。 #28552 由 Adam Li 貢獻。
sklearn.utils
#
修正 當
axis=0
時,_safe_indexing
現在可以正確處理 polars DataFrame,並支援索引 polars Series。 #28521 由 Yao Xiao 貢獻。API 變更
utils.IS_PYPY
已被棄用,並將在 1.7 版本中移除。 #28768 由 Jérémie du Boisberranger 貢獻。API 變更
utils.tosequence
已被棄用,並將在 1.7 版本中移除。 #28763 由 Jérémie du Boisberranger 貢獻。API 變更
utils.parallel_backend
和utils.register_parallel_backend
已被棄用,並將在 1.7 版本中移除。請改用joblib.parallel_backend
和joblib.register_parallel_backend
。 #28847 由 Jérémie du Boisberranger 貢獻。API 變更 當以位元組表示時,在
type_of_target
中引發資訊豐富的警告訊息。對於分類器和分類指標,以位元組編碼的標籤已被棄用,並將在 v1.7 中引發錯誤。 #18555 由 Kaushik Amar Das 貢獻。API 變更
utils.estimator_checks.check_estimator_sparse_data
已拆分為兩個函式:utils.estimator_checks.check_estimator_sparse_matrix
和utils.estimator_checks.check_estimator_sparse_array
。 #27576 由 Stefanie Senger 貢獻。
程式碼和文件貢獻者
感謝自 1.4 版以來為維護和改進此專案做出貢獻的每個人,包括
101AlexMartin, Abdulaziz Aloqeely, Adam J. Stewart, Adam Li, Adarsh Wase, Adeyemi Biola, Aditi Juneja, Adrin Jalali, Advik Sinha, Aisha, Akash Srivastava, Akihiro Kuno, Alan Guedes, Alberto Torres, Alexis IMBERT, alexqiao, Ana Paula Gomes, Anderson Nelson, Andrei Dzis, Arif Qodari, Arnaud Capitaine, Arturo Amor, Aswathavicky, Audrey Flanders, awwwyan, baggiponte, Bharat Raghunathan, bme-git, brdav, Brendan Lu, Brigitta Sipőcz, Bruno, Cailean Carter, Cemlyn, Christian Lorentzen, Christian Veenhuis, Cindy Liang, Claudio Salvatore Arcidiacono, Connor Boyle, Conrad Stevens, crispinlogan, David Matthew Cherney, Davide Chicco, davidleon123, dependabot[bot], DerWeh, dinga92, Dipan Banik, Drew Craeton, Duarte São José, DUONG, Eddie Bergman, Edoardo Abati, Egehan Gunduz, Emad Izadifar, EmilyXinyi, Erich Schubert, Evelyn, Filip Karlo Došilović, Franck Charras, Gael Varoquaux, Gönül Aycı, Guillaume Lemaitre, Gyeongjae Choi, Harmanan Kohli, Hong Xiang Yue, Ian Faust, Ilya Komarov, itsaphel, Ivan Wiryadi, Jack Bowyer, Javier Marin Tur, Jérémie du Boisberranger, Jérôme Dockès, Jiawei Zhang, João Morais, Joe Cainey, Joel Nothman, Johanna Bayer, John Cant, John Enblom, John Hopfensperger, jpcars, jpienaar-tuks, Julian Chan, Julian Libiseller-Egger, Julien Jerphanion, KanchiMoe, Kaushik Amar Das, keyber, Koustav Ghosh, kraktus, Krsto Proroković, Lars, ldwy4, LeoGrin, lihaitao, Linus Sommer, Loic Esteve, Lucy Liu, Lukas Geiger, m-maggi, manasimj, Manuel Labbé, Manuel Morales, Marco Edward Gorelli, Marco Wolsza, Maren Westermann, Marija Vlajic, Mark Elliot, Martin Helm, Mateusz Sokół, mathurinm, Mavs, Michael Dawson, Michael Higgins, Michael Mayer, miguelcsilva, Miki Watanabe, Mohammed Hamdy, myenugula, Nathan Goldbaum, Naziya Mahimkar, nbrown-ScottLogic, Neto, Nithish Bolleddula, notPlancha, Olivier Grisel, Omar Salman, ParsifalXu, Patrick Wang, Pierre de Fréminville, Piotr, Priyank Shroff, Priyansh Gupta, Priyash Shah, Puneeth K, Rahil Parikh, raisadz, Raj Pulapakura, Ralf Gommers, Ralph Urlus, Randolf Scholz, renaissance0ne, Reshama Shaikh, Richard Barnes, Robert Pollak, Roberto Rosati, Rodrigo Romero, rwelsch427, Saad Mahmood, Salim Dohri, Sandip Dutta, SarahRemus, scikit-learn-bot, Shaharyar Choudhry, Shubham, sperret6, Stefanie Senger, Steffen Schneider, Suha Siddiqui, Thanh Lam DANG, thebabush, Thomas, Thomas J. Fan, Thomas Lazarus, Tialo, Tim Head, Tuhin Sharma, Tushar Parimi, VarunChaduvula, Vineet Joshi, virchan, Waël Boukhobza, Weyb, Will Dean, Xavier Beltran, Xiao Yuan, Xuefeng Xu, Yao Xiao, yareyaredesuyo, Ziad Amerr, Štěpán Sršeň