誰在使用 scikit-learn?#
摩根大通 (J.P.Morgan)#
Spotify#
法國國家資訊與自動化研究所 (Inria)#
betaworks#
Betaworks 是一家位於紐約市的新創工作室,致力於建立新產品、發展公司並投資其他公司。在過去 8 年中,我們推出了許多基於社群資料分析的服務,例如 Bitly、Chartbeat、digg 和 Scale Model。betaworks 資料科學團隊一直將 Scikit-learn 用於各種任務。從探索性分析到產品開發,它是我們工具包中不可或缺的一部分。最近的應用包括在 digg 的新影片推薦系統和 Poncho 的 動態啟發式子空間叢集中使用。
Gilad Lotan,首席資料科學家
Hugging Face#
Evernote#
建立分類器通常是一個迭代的過程,包括探索資料、選擇特徵(被認為在某種程度上有預測能力的資料屬性)、訓練模型,最後評估它們。對於許多這些任務,我們依賴於出色的 Python 套件 scikit-learn。
Mark Ayzenshtat,擴增智慧副總裁
巴黎電信學院 (Télécom ParisTech)#
Booking.com#
AWeber#
scikit-learn 工具組對於 AWeber 的資料分析和管理團隊來說是不可或缺的。它讓我們能夠完成如果沒有時間或資源就無法完成的 AWesome 工作。文件非常出色,讓新工程師可以快速評估並將許多不同的演算法應用於我們的資料。當處理 AWeber 的大量電子郵件內容時,文字特徵擷取工具非常有用。RandomizedPCA 實作與 Pipelining 和 FeatureUnions 一起,讓我們能夠有效且可靠地開發複雜的機器學習演算法。
任何有興趣了解更多關於 AWeber 如何在生產環境中部署 scikit-learn 的人,都應該查看 AWeber 的 Michael Becker 在 PyData Boston 的演講,網址為 mdbecker/pydata_2013。
Michael Becker,軟體工程師,資料分析和管理忍者
Yhat#
Rangespan#
Birchbox#
Bestofmedia Group#
Change.org#
PHIMECA Engineering#
HowAboutWe#
PeerIndex#
DataRobot#
OkCupid#
Lovely#
Data Publica#
Machinalis#
Scikit-learn 是 Machinalis 所有機器學習專案的基石。它具有一致的 API、廣泛的演算法選擇,以及許多處理樣板程式碼的輔助工具。我們已在各種專案的生產環境中使用它,包括點擊率預測、資訊提取,甚至是數羊!
事實上,我們使用它的頻率如此之高,以至於我們開始將常見的使用案例凍結成 Python 套件,其中一些是開源的,例如 FeatureForge。一句話總結 scikit-learn:太棒了。
Rafael Carrascosa,首席開發人員
solido#
Scikit-learn 正在透過 Solido 協助推動摩爾定律。Solido 開發電腦輔助設計工具,供大多數前 20 大半導體公司和晶圓廠使用,以設計智慧型手機、汽車等內部最先進的晶片。Scikit-learn 有助於為 Solido 用於罕見事件估計、最差情況驗證、最佳化等的演算法提供動力。在 Solido,我們特別喜歡 scikit-learn 的高斯過程模型、大規模正規化線性迴歸和分類函式庫。Scikit-learn 提高了我們的生產力,因為對於許多機器學習問題,我們不再需要「自己編寫」程式碼。這個 PyData 2014 演講有詳細資訊。
Trent McConaghy,Solido Design Automation Inc. 創辦人
INFONEA#
Dataiku#
我們的軟體 Data Science Studio (DSS) 使使用者能夠建立結合 ETL 和機器學習的數據服務。我們的機器學習模組整合了許多 scikit-learn 演算法。scikit-learn 函式庫與 DSS 的整合非常完美,因為它提供了幾乎適用於所有業務案例的演算法。我們的目標是提供一個透明且靈活的工具,使最佳化構建數據服務、準備數據以及在所有類型的數據上訓練機器學習演算法的耗時方面變得更加容易。
Florian Douetteau,Dataiku 執行長
Otto Group#
在 Otto Group,全球五大 B2C 線上零售商之一,我們在日常工作的各個方面都使用 scikit-learn,從數據探索到機器學習應用程式的開發,再到這些服務的生產部署。它幫助我們解決從電子商務到物流的各種機器學習問題。其一致的 API 使我們能夠圍繞它構建 Palladium REST-API 框架,並持續交付基於 scikit-learn 的服務。
Christian Rammig,Otto Group 數據科學主管
Zopa#
MARS#
BNP Paribas Cardif#
BNP Paribas Cardif 在其生產環境中的幾個機器學習模型中使用了 scikit-learn。我們的內部開發人員和數據科學家社群自 2015 年以來一直在使用 scikit-learn,原因有很多:開發品質、文件說明和貢獻治理,以及龐大的貢獻者社群。我們甚至在內部模型風險治理中明確提及使用 scikit-learn 的管道,作為我們減少營運風險和過擬合風險的良好實務之一。為了支持開源軟體開發,特別是 scikit-learn 專案,我們決定自 2018 年成立以來就參與在 La Fondation Inria 的 scikit-learn 聯盟。
Sébastien Conort,BNP Paribas Cardif 首席數據科學家