consensus_score#
- sklearn.metrics.consensus_score(a, b, *, similarity='jaccard')[原始碼]#
兩個雙聚類集合的相似性。
計算個別雙聚類之間的相似性。然後,使用修改後的 Jonker-Volgenant 演算法解決線性總和分配問題,找出集合之間最佳的匹配。最終分數是相似性總和除以較大集合的大小。
在使用者指南中閱讀更多資訊。
- 參數:
- atuple (rows, columns)
一組雙聚類的行和列指標的元組。
- btuple (rows, columns)
類似
a
的另一組雙聚類。- similarity‘jaccard’ 或可呼叫物件,預設值為 ‘jaccard’
可以是字串 “jaccard” 以使用 Jaccard 係數,或任何接受四個引數的函數,每個引數都是一個 1 維指標向量:(a_rows、a_columns、b_rows、b_columns)。
- 回傳:
- consensus_scorefloat
共識分數,一個非負值,是相似性總和除以較大集合的大小。
另請參閱
scipy.optimize.linear_sum_assignment
解決線性總和分配問題。
參考文獻
Hochreiter, Bodenhofer 等人,2010 年。FABIA:用於雙聚類獲取的因素分析。
範例
>>> from sklearn.metrics import consensus_score >>> a = ([[True, False], [False, True]], [[False, True], [True, False]]) >>> b = ([[False, True], [True, False]], [[True, False], [False, True]]) >>> consensus_score(a, b, similarity='jaccard') np.float64(1.0)