k-means k 均值算法

注意仅在凸形簇结构上效果较好。
Image Loading
最小化9.24是一个 NP 难问题,需要考察样本集 D 的所有可能的簇划分才能找到最优解。
k 均值算法采用了贪心策略,通过迭代优化来近似求解。
先随机选择 k 个样本作为 center,然后所有样本归属到离得最近的 center 所在的 cluster,然后每个 cluster 重新计算中心位置。循环。
Image Loading

Ref

[1] 机器学习 - 周志华