卡林斯基-哈拉巴斯分數#

sklearn.metrics.calinski_harabasz_score(X, labels)[原始碼]#

計算卡林斯基和哈拉巴斯分數。

也稱為變異數比率準則。

分數定義為群集間離散總和與群集內離散總和的比率。

請在 使用者指南 中閱讀更多資訊。

參數:
X形狀為 (n_samples, n_features) 的類陣列

一個 n_features 維資料點列表。每一列對應一個資料點。

labels形狀為 (n_samples,) 的類陣列

每個樣本的預測標籤。

回傳值:
score浮點數

產生的卡林斯基-哈拉巴斯分數。

參考文獻

範例

>>> from sklearn.datasets import make_blobs
>>> from sklearn.cluster import KMeans
>>> from sklearn.metrics import calinski_harabasz_score
>>> X, _ = make_blobs(random_state=0)
>>> kmeans = KMeans(n_clusters=3, random_state=0,).fit(X)
>>> calinski_harabasz_score(X, kmeans.labels_)
np.float64(114.8...)