聚类,就是将样本划分为由类似的对象组成的多个类的过程。聚类后,我们可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测;也可以探究不同类之间的相关性和主要差异。聚类和分类的区别:分类是已知类别的,聚类未知。K-means和K-means++聚类算法系统(层次)聚类DBSCAN算法选择:只有两个指标,且你做出散点图后发现数据表现的很“DBSCAN”,这时候再用DBSCAN进行聚类。 其他情况下,全部使用系统聚类吧。 K-means也可以用,不过用了的话你论文上可写的东西比较少