教師なし分類法が利用可能

https://stackoverflow.com/questions/1754873

20-09-2019
|

質問

私は「教師なし分類」に関する研究を行っています。基本的に私は trainSet を持っており、教師なしの方法で X 個のクラスにデータをクラスタリングしたいと考えています。考え方は K-means の動作と似ています。

まあ言ってみれば

ステップ1）FeatureSetは[1057x10]マトリスであり、88のクラスターにクラスターする必要があります。

ステップ2）以前に計算されたクラスを使用して、testDataの分類方法を計算する

質問 - SVMまたはNNでそれを行うことは可能ですか？他に何か？-他にお勧めはありますか？

解決

があり、多くのクラスタリングアルゴリズムはそこにある、とウェブは、それらの情報およびサンプルの実装であふれています。良い出発点は、クラスタ分析 Cluster_analysis の上のWikipediaのエントリです。

あなたが働いK-意味の実装を持っているとして、あなたは、彼らがより良い結果yeildかどうかを確認するために多くの亜種のいずれかを試みることができる（K-手段++多分、見てあなたはSVMを述べたように）。あなたは完全に異なるアプローチをしたい場合は、コホネン地図を見ている - また、自己組織化と呼ばれるマップフィーチャー。それはあまりにもトリッキーに見える場合は、簡単な階層的クラスタリングは、（すすぎと繰り返し、コンバイン、最寄りの二つのアイテムを見つける。）実装が容易になります。

他のヒント

これは典型的なクラスタリングの問題のように思えます。SVM もニューラルネットワークも、この問題を直接解決することはできません。どちらのアプローチも使用できます次元削減, たとえば、10 次元データを 2 次元空間に埋め込むことができますが、データが自動的にクラスターに配置されるわけではありません。

K 平均法以外にも膨大な数のクラスタリングアルゴリズムがあります。対照的なアプローチが必要な場合は、次の方法を試してみるとよいでしょう。凝集クラスタリングアルゴリズム。どのようなコンピュータ環境を使用しているか分かりませんが、私はとても気に入っています R そしてクラスタリングに関するこの (非常に) 短いガイド.

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow