sklearn.random_projection#
隨機投影轉換器。
隨機投影是一種簡單且計算效率高的方法,透過在處理速度更快和模型大小更小的優勢之間,權衡可控制的準確度損失(以額外變異數的形式),來降低資料的維度。
隨機投影矩陣的維度和分佈受到控制,以保留資料集中任意兩個樣本之間的成對距離。
隨機投影效率背後的主要理論結果是 Johnson-Lindenstrauss 引理(引用維基百科)
在數學中,Johnson-Lindenstrauss 引理是有關將高維空間的點低失真嵌入到低維歐幾里得空間的結果。該引理指出,高維空間中的一小組點可以嵌入到維度低得多的空間中,使得點之間的距離幾乎得以保留。用於嵌入的映射至少是利普希茨連續的,甚至可以取為正交投影。
使用者指南。 有關更多詳細資訊,請參閱 隨機投影 章節。
通過高斯隨機投影降低維度。 |
|
通過稀疏隨機投影降低維度。 |
|
尋找一個「安全」的成分數量,以隨機投影到該數量。 |