题
我正在做一项涉及“无监督分类”的研究。基本上我有一个 trainSet,我想以无监督的方式将数据聚类到 X 个类中。想法与 k-means 的做法类似。
比方说
step1)功能网是一个[1057x10] Matrice,我想将它们聚集到88个簇中。
步骤2)使用先前计算的类来计算如何对testdata进行分类
问题 - 可以使用SVM或NN进行吗?还要别的吗 ?- 还有其他建议吗?
解决方案
有许多聚类算法在那里,和网络是充斥着对它们和信息示例实现。一个好的起点是聚类分析 Cluster_analysis 。
当你有一个工作的k-means实现,你可以尝试使用一些其他变体之一,看看他们一代产量更好的结果(k均值++或许,看到你所提到的SVM)。如果你想要一个完全不同的方法,看看Kohonen的地图 - 也被称为自组织特征映射。如果这看起来太不靠谱,一个简单的分层聚类将容易实现(查找最近的两个项目,结合,冲洗和重复)。
其他提示
这听起来像是一个经典的聚类问题。支持向量机或神经网络都无法直接解决这个问题。您可以使用任一方法 降维, ,例如将你的10维数据嵌入到二维空间中,但是他们不会帮你把数据放入聚类中。
除了 k 均值之外,还有大量的聚类算法。如果您想要一种对比方法,您可能想尝试 凝聚聚类 算法。我不知道你使用什么样的计算环境,但我很喜欢 右 和 这个(非常)简短的聚类指南.
不隶属于 StackOverflow