我正在做一项涉及“无监督分类”的研究。基本上我有一个 trainSet,我想以无监督的方式将数据聚类到 X 个类中。想法与 k-means 的做法类似。

比方说

step1)功能网是一个[1057x10] Matrice,我想将它们聚集到88个簇中。

步骤2)使用先前计算的类来计算如何对testdata进行分类

问题 - 可以使用SVM或NN进行吗?还要别的吗 ?- 还有其他建议吗?

有帮助吗?

解决方案

有许多聚类算法在那里,和网络是充斥着对它们和信息示例实现。一个好的起点是聚类分析 Cluster_analysis 。

当你有一个工作的k-means实现,你可以尝试使用一些其他变体之一,看看他们一代产量更好的结果(k均值++或许,看到你所提到的SVM)。如果你想要一个完全不同的方法,看看Kohonen的地图 - 也被称为自组织特征映射。如果这看起来太不靠谱,一个简单的分层聚类将容易实现(查找最近的两个项目,结合,冲洗和重复)。

其他提示

这听起来像是一个经典的聚类问题。支持向量机或神经网络都无法直接解决这个问题。您可以使用任一方法 降维, ,例如将你的10维数据嵌入到二维空间中,但是他们不会帮你把数据放入聚类中。

除了 k 均值之外,还有大量的聚类算法。如果您想要一种对比方法,您可能想尝试 凝聚聚类 算法。我不知道你使用什么样的计算环境,但我很喜欢 这个(非常)简短的聚类指南.

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top