可用的无监督分类方法

https://stackoverflow.com/questions/1754873

20-09-2019
|

题

我正在做一项涉及“无监督分类”的研究。基本上我有一个 trainSet，我想以无监督的方式将数据聚类到 X 个类中。想法与 k-means 的做法类似。

比方说

step1）功能网是一个[1057x10] Matrice，我想将它们聚集到88个簇中。

步骤2）使用先前计算的类来计算如何对testdata进行分类

问题 - 可以使用SVM或NN进行吗？还要别的吗？- 还有其他建议吗？

解决方案

有许多聚类算法在那里，和网络是充斥着对它们和信息示例实现。一个好的起点是聚类分析 Cluster_analysis 。

当你有一个工作的k-means实现，你可以尝试使用一些其他变体之一，看看他们一代产量更好的结果（k均值++或许，看到你所提到的SVM）。如果你想要一个完全不同的方法，看看Kohonen的地图 - 也被称为自组织特征映射。如果这看起来太不靠谱，一个简单的分层聚类将容易实现（查找最近的两个项目，结合，冲洗和重复）。

其他提示

这听起来像是一个经典的聚类问题。支持向量机或神经网络都无法直接解决这个问题。您可以使用任一方法降维, ，例如将你的10维数据嵌入到二维空间中，但是他们不会帮你把数据放入聚类中。

除了 k 均值之外，还有大量的聚类算法。如果您想要一种对比方法，您可能想尝试凝聚聚类算法。我不知道你使用什么样的计算环境，但我很喜欢右和这个（非常）简短的聚类指南.

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow