版本 0.17#

版本 0.17.1#

2016 年 2 月 18 日

變更日誌#

錯誤修復#

  • 升級供應商 joblib 至 0.9.4 版本,修復了 joblib.Parallel 中的一個重要錯誤,當處理大於 1MB 的資料集時,可能會靜默地產生錯誤的結果:joblib/joblib

  • 修正了讀取使用 scikit-learn 版本 <= 0.16 產生的 Bunch pickles 的問題。這可能會影響已經使用 scikit-learn 0.16 下載資料集並使用 scikit-learn 0.17 載入的用戶。請參閱 #6196,了解這如何影響 datasets.fetch_20newsgroups。由 Loic Esteve 提供。

  • 修復了一個錯誤,該錯誤阻止在大型陣列上使用 ROC AUC 分數在多個 CPU/核心上執行網格搜尋。請參閱 #6147。由 Olivier Grisel 提供。

  • 修復了一個錯誤,該錯誤阻止正確設定 ensemble.GradientBoostingRegressor 中的 presort 參數。請參閱 #5857。由 Andrew McCulloh 提供。

  • 修復了評估 decomposition.LatentDirichletAllocation 模型的困惑度時的 joblib 錯誤。請參閱 #6258。由 Chyi-Kwei Yau 提供。

版本 0.17#

2015 年 11 月 5 日

變更日誌#

新功能#

增強功能#

錯誤修正#

API 變更摘要#

  • preprocessing.MinMaxScaler 中的屬性 data_mindata_maxdata_range 已被棄用,並且從 0.19 版本開始將不再可用。取而代之的是,該類別現在會公開 data_min_data_max_data_range_。由 Giorgio Patrini 提供。

  • 所有縮放器類別現在都有一個 scale_ 屬性,這是它們的 transform 方法所應用的特徵式重新縮放。preprocessing.StandardScaler 中的舊屬性 std_ 已被棄用,並由 scale_ 取代;它在 0.19 版本中將不再可用。由 Giorgio Patrini 提供。

  • svm.SVCsvm.NuSVC 現在有一個 decision_function_shape 參數,可藉由設定 decision_function_shape='ovr',使其決策函數的形狀為 (n_samples, n_classes)。這將會是從 0.19 版本開始的預設行為。由 Andreas Müller 提供。

  • 現在不建議將 1D 資料陣列作為估計器的輸入,因為這會在如何將陣列元素解讀為特徵或樣本方面造成混淆。現在所有資料陣列都應該明確地塑造為 (n_samples, n_features)。由 Vighnesh Birodkar 提供。

  • lda.LDAqda.QDA 已被移至 discriminant_analysis.LinearDiscriminantAnalysisdiscriminant_analysis.QuadraticDiscriminantAnalysis

  • store_covariancetol 參數已從 fit 方法移至 discriminant_analysis.LinearDiscriminantAnalysis 的建構函式中,而 store_covariancestol 參數已從 fit 方法移至 discriminant_analysis.QuadraticDiscriminantAnalysis 的建構函式中。

  • 繼承自 _LearntSelectorMixin 的模型將不再支援 transform 方法(即 RandomForests、GradientBoosting、LogisticRegression、DecisionTrees、SVMs 和 SGD 相關模型)。請將這些模型包裝在元轉換器 feature_selection.SelectFromModel 周圍,以移除低於特定閾值的特徵(根據 coefs_feature_importances_)。

  • 如果發生非收斂情況,cluster.KMeans 會重新執行叢集指派,以確保 predict(X)labels_ 的一致性。由 Vighnesh Birodkar 提供。

  • 分類器和迴歸器模型現在會使用 _estimator_type 屬性來標記。

  • 交叉驗證迭代器總是會提供訓練集和測試集的索引,而不是布林遮罩。

  • 所有迴歸器上的 decision_function 已被棄用,並將在 0.19 版本中移除。請改用 predict

  • datasets.load_lfw_pairs 已被棄用,並將在 0.19 版本中移除。請改用 datasets.fetch_lfw_pairs

  • 已移除已棄用的 hmm 模組。

  • 已移除已棄用的 Bootstrap 交叉驗證迭代器。

  • 已移除已棄用的 WardWardAgglomerative 類別。請改用 cluster.AgglomerativeClustering

  • cross_validation.check_cv 現在是一個公開函數。

  • linear_model.LinearRegression 的屬性 residues_ 已被棄用,並將在 0.19 版本中移除。

  • linear_model.LinearRegression 已棄用的 n_jobs 參數已移至建構函式。

  • 已從 linear_model.SGDClassifierfit 方法中移除已棄用的 class_weight 參數。請改用建構參數。

  • 已移除已棄用的序列的序列(或列表的列表)多標籤格式的支援。若要轉換為支援的二元指示矩陣格式或從該格式轉換,請使用 MultiLabelBinarizer

  • 在 0.19 版本中,呼叫 Pipeline.pipelineinverse_transform 方法的行為將會改變。它將不再將一維輸入重新塑造為二維輸入。

  • 已棄用的屬性 indicator_matrix_multilabel_classes_ 已從 preprocessing.LabelBinarizer 中移除。

  • svm.SVCsvm.SVR 中使用 gamma=0 自動將 gamma 設定為 1. / n_features 的方式已被棄用,並將在 0.19 版本中移除。請改用 gamma="auto"

程式碼貢獻者#

Aaron Schumacher, Adithya Ganesh, akitty, Alexandre Gramfort, Alexey Grigorev, Ali Baharev, Allen Riddell, Ando Saabas, Andreas Mueller, Andrew Lamb, Anish Shah, Ankur Ankan, Anthony Erlinger, Ari Rouvinen, Arnaud Joly, Arnaud Rachez, Arthur Mensch, banilo, Barmaley.exe, benjaminirving, Boyuan Deng, Brett Naul, Brian McFee, Buddha Prakash, Chi Zhang, Chih-Wei Chang, Christof Angermueller, Christoph Gohlke, Christophe Bourguignat, Christopher Erick Moody, Chyi-Kwei Yau, Cindy Sridharan, CJ Carey, Clyde-fare, Cory Lorenz, Dan Blanchard, Daniel Galvez, Daniel Kronovet, Danny Sullivan, Data1010, David, David D Lowe, David Dotson, djipey, Dmitry Spikhalskiy, Donne Martin, Dougal J. Sutherland, Dougal Sutherland, edson duarte, Eduardo Caro, Eric Larson, Eric Martin, Erich Schubert, Fernando Carrillo, Frank C. Eckert, Frank Zalkow, Gael Varoquaux, Ganiev Ibraim, Gilles Louppe, Giorgio Patrini, giorgiop, Graham Clenaghan, Gryllos Prokopis, gwulfs, Henry Lin, Hsuan-Tien Lin, Immanuel Bayer, Ishank Gulati, Jack Martin, Jacob Schreiber, Jaidev Deshpande, Jake Vanderplas, Jan Hendrik Metzen, Jean Kossaifi, Jeffrey04, Jeremy, jfraj, Jiali Mei, Joe Jevnik, Joel Nothman, John Kirkham, John Wittenauer, Joseph, Joshua Loyal, Jungkook Park, KamalakerDadi, Kashif Rasul, Keith Goodman, Kian Ho, Konstantin Shmelkov, Kyler Brown, Lars Buitinck, Lilian Besson, Loic Esteve, Louis Tiao, maheshakya, Maheshakya Wijewardena, Manoj Kumar, MarkTab marktab.net, Martin Ku, Martin Spacek, MartinBpr, martinosorb, MaryanMorel, Masafumi Oyamada, Mathieu Blondel, Matt Krump, Matti Lyra, Maxim Kolganov, mbillinger, mhg, Michael Heilman, Michael Patterson, Miroslav Batchkarov, Nelle Varoquaux, Nicolas, Nikolay Mayorov, Olivier Grisel, Omer Katz, Óscar Nájera, Pauli Virtanen, Peter Fischer, Peter Prettenhofer, Phil Roth, pianomania, Preston Parry, Raghav RV, Rob Zinkov, Robert Layton, Rohan Ramanath, Saket Choudhary, Sam Zhang, santi, saurabh.bansod, scls19fr, Sebastian Raschka, Sebastian Saeger, Shivan Sornarajah, SimonPL, sinhrks, Skipper Seabold, Sonny Hu, sseg, Stephen Hoover, Steven De Gryze, Steven Seguin, Theodore Vasiloudis, Thomas Unterthiner, Tiago Freitas Pereira, Tian Wang, Tim Head, Timothy Hopper, tokoroten, Tom Dupré la Tour, Trevor Stephens, Valentin Stolbunov, Vighnesh Birodkar, Vinayak Mehta, Vincent, Vincent Michel, vstolbunov, wangz10, Wei Xue, Yucheng Low, Yury Zhauniarovich, Zac Stewart, zhai_pro, Zichen Wang