版本 0.16#

版本 0.16.1#

2015 年 4 月 14 日

更新日誌#

錯誤修復#

版本 0.16#

2015 年 3 月 26 日

重點#

  • 速度改進(特別是在 cluster.DBSCAN 中),減少記憶體需求、錯誤修復和更好的預設設定。

  • 多項式邏輯回歸和 linear_model.LogisticRegressionCV 中的路徑演算法。

  • 通過 decomposition.IncrementalPCA 進行 PCA 的核心外學習。

  • 使用 calibration.CalibratedClassifierCV 校準分類器的機率。

  • 用於大規模數據集的 cluster.Birch 分群方法。

  • 使用 neighbors.LSHForest 中基於局部敏感雜湊森林的可擴展近似最近鄰搜尋。

  • 改進的錯誤訊息,以及使用格式錯誤的輸入資料時更好的驗證。

  • 與 pandas 資料框更穩健的整合。

更新日誌#

新功能#

增強功能#

文件改進#

錯誤修正#

API 變更摘要#

  • GridSearchCVcross_val_score 以及其他元估計器不再將 pandas DataFrames 轉換為陣列,允許在自定義估計器中使用 DataFrame 特定的操作。

  • multiclass.fit_ovrmulticlass.predict_ovrpredict_proba_ovrmulticlass.fit_ovomulticlass.predict_ovomulticlass.fit_ecocmulticlass.predict_ecoc 已被棄用。請改用底層的估計器。

  • 最近鄰估計器過去會接受任意關鍵字參數,並將它們傳遞給它們的距離度量。scikit-learn 0.18 將不再支援此功能;請改用 metric_params 參數。

  • fit 方法的 n_jobs 參數已移至

    LinearRegression 類的建構函式中。

  • 在多類別情況下,multiclass.OneVsRestClassifierpredict_proba 方法現在每個樣本返回兩個機率;這與其他估計器和該方法的文件一致,但之前的版本意外地只返回了正機率。由 Will Lamond 和 Lars Buitinck 修正。

  • linear_model.ElasticNetlinear_model.Lasso 中 precompute 的預設值變更為 False。當 n_samples > n_features 時,將 precompute 設定為 “auto” 被發現速度較慢,因為 Gram 矩陣的計算成本很高,而且抵消了僅針對一個 alpha 擬合 Gram 的好處。precompute="auto" 現在已被棄用,並將在 0.18 中移除。由 Manoj Kumar 修正。

  • linear_model.enet_pathlinear_model.enet_path 中公開 positive 選項,該選項會將係數限制為正數。由 Manoj Kumar 修正。

  • 當執行多類別或多標籤(即非二元)分類時,使用者現在應向 sklearn.metrics.f1_scoresklearn.metrics.fbeta_scoresklearn.metrics.recall_scoresklearn.metrics.precision_score 提供明確的 average 參數。由 Joel Nothman 修正。

  • 交叉驗證的 scoring 參數現在接受 'f1_micro''f1_macro''f1_weighted''f1' 現在僅用於二元分類。類似的變更也適用於 'precision''recall'。由 Joel Nothman 修正。

  • 已移除 linear_model.enet_pathlinear_model.lasso_path 中的 fit_interceptnormalizereturn_models 參數。它們自 0.14 版本以來已被棄用。

  • 從現在開始,當在模型擬合之前調用任何類似 predict 的方法時,所有估計器都會統一引發 NotFittedError。由 Raghav RV 修正。

  • 重構了輸入資料驗證,以實現更一致的輸入驗證。check_arrays 函式已由 check_arraycheck_X_y 取代。由 Andreas Müller 修正。

  • 允許在 sklearn.neighbors.NearestNeighbors 及其相關類別的 radius_neighborskneighborskneighbors_graphradius_neighbors_graph 方法中使用 X=None。如果設定為 None,則對於每個樣本,這將避免將樣本本身設定為第一個最近鄰。由 Manoj Kumar 修正。

  • neighbors.kneighbors_graphneighbors.radius_neighbors_graph 中新增參數 include_self,該參數必須由使用者明確設定。如果設定為 True,則樣本本身被視為第一個最近鄰。

  • GMMDPGMMVBGMM 中,thresh 參數已被棄用,改用新的 tol 參數。有關詳細資訊,請參閱 Enhancements 部分。由 Hervé Bredin 修正。

  • 估計器在可能的情況下會將 dtype 為 object 的輸入視為數值型別。由 Andreas Müller 提供。

  • 當估計器在空資料(對於 2D 輸入,樣本數少於 1 或特徵數少於 1)上擬合時,現在會一致地引發 ValueError 錯誤。由 Olivier Grisel 提供。

  • linear_model.SGDClassifierlinear_model.SGDRegressorlinear_model.Perceptronlinear_model.PassiveAggressiveClassifierlinear_model.PassiveAggressiveRegressorshuffle 選項現在預設為 True

  • cluster.DBSCAN 現在使用確定性的初始化。 random_state 參數已被棄用。由 Erich Schubert 提供。

程式碼貢獻者#

A. Flaxman, Aaron Schumacher, Aaron Staple, abhishek thakur, Akshay, akshayah3, Aldrian Obaja, Alexander Fabisch, Alexandre Gramfort, Alexis Mignon, Anders Aagaard, Andreas Mueller, Andreas van Cranenburgh, Andrew Tulloch, Andrew Walker, Antony Lee, Arnaud Joly, banilo, Barmaley.exe, Ben Davies, Benedikt Koehler, bhsu, Boris Feld, Borja Ayerdi, Boyuan Deng, Brent Pedersen, Brian Wignall, Brooke Osborn, Calvin Giles, Cathy Deng, Celeo, cgohlke, chebee7i, Christian Stade-Schuldt, Christof Angermueller, Chyi-Kwei Yau, CJ Carey, Clemens Brunner, Daiki Aminaka, Dan Blanchard, danfrankj, Danny Sullivan, David Fletcher, Dmitrijs Milajevs, Dougal J. Sutherland, Erich Schubert, Fabian Pedregosa, Florian Wilhelm, floydsoft, Félix-Antoine Fortin, Gael Varoquaux, Garrett-R, Gilles Louppe, gpassino, gwulfs, Hampus Bengtsson, Hamzeh Alsalhi, Hanna Wallach, Harry Mavroforakis, Hasil Sharma, Helder, Herve Bredin, Hsiang-Fu Yu, Hugues SALAMIN, Ian Gilmore, Ilambharathi Kanniah, Imran Haque, isms, Jake VanderPlas, Jan Dlabal, Jan Hendrik Metzen, Jatin Shah, Javier López Peña, jdcaballero, Jean Kossaifi, Jeff Hammerbacher, Joel Nothman, Jonathan Helmus, Joseph, Kaicheng Zhang, Kevin Markham, Kyle Beauchamp, Kyle Kastner, Lagacherie Matthieu, Lars Buitinck, Laurent Direr, leepei, Loic Esteve, Luis Pedro Coelho, Lukas Michelbacher, maheshakya, Manoj Kumar, Manuel, Mario Michael Krell, Martin, Martin Billinger, Martin Ku, Mateusz Susik, Mathieu Blondel, Matt Pico, Matt Terry, Matteo Visconti dOC, Matti Lyra, Max Linke, Mehdi Cherti, Michael Bommarito, Michael Eickenberg, Michal Romaniuk, MLG, mr.Shu, Nelle Varoquaux, Nicola Montecchio, Nicolas, Nikolay Mayorov, Noel Dawe, Okal Billy, Olivier Grisel, Óscar Nájera, Paolo Puggioni, Peter Prettenhofer, Pratap Vardhan, pvnguyen, queqichao, Rafael Carrascosa, Raghav R V, Rahiel Kasim, Randall Mason, Rob Zinkov, Robert Bradshaw, Saket Choudhary, Sam Nicholls, Samuel Charron, Saurabh Jha, sethdandridge, sinhrks, snuderl, Stefan Otte, Stefan van der Walt, Steve Tjoa, swu, Sylvain Zimmer, tejesh95, terrycojones, Thomas Delteil, Thomas Unterthiner, Tomas Kazmar, trevorstephens, tttthomasssss, Tzu-Ming Kuo, ugurcaliskan, ugurthemaster, Vinayak Mehta, Vincent Dubourg, Vjacheslav Murashkin, Vlad Niculae, wadawson, Wei Xue, Will Lamond, Wu Jiang, x0l, Xinfan Meng, Yan Yi, Yu-Chin