[技术讨论] 近期通过C#实现的K-Means算法原理，请前辈指正 [复制链接]

snisn

军衔等级：

新兵

电梯直达

1^# 大中小

发表于 2018-6-4 16:34:09 |只看该作者 |倒序浏览

大家好！近期对K-Means算法做了学习。众所周知，K-Means是经典的大数据聚类算法之一，通过均值算法将数据进行聚类，遵循最小误差平方和准则，所有类簇的误差平方和越小，则该K类的聚类效果越优。KMeans无法通过解析求最小值，只能通过迭代求解。
通过伪代码表述的K-Means算法基本过程为：
1 创建K个点作为初始质心点（位置随机）
2 While（当任意样本点的分类发生改变时）
{
      for（对每个样本点）
      {
for（对每个质心）
{
计算样本点到质心的距离
}
将样本点划分至距离最小的质心类
      }
      计算每个类的均值，作为该类新的质心
}
3 算法结束

附件是通过C#实现的K-Means算法程序的原始工程文件，实现的效果如下图所示。初次学习，理解还不够深入，恳请各位前辈指正，谢谢！