طرق التصنيف غير الخاضعة للرقابة المتاحة

https://stackoverflow.com/questions/1754873

20-09-2019
|

سؤال

أقوم بإجراء بحث يتضمن "تصنيفًا غير خاضع للإشراف". في الأساس ، لديّ Trainset وأريد تجميع البيانات في عدد X من الفئات بطريقة غير خاضعة للإشراف. تشبه الفكرة ما يفعله K-Means.

دعنا نقول

Step1) الميزات هي matrice [1057x10] وأريد تجميعها في 88 مجموعة.

Step2) استخدم الفئات المحسوبة مسبقًا لحساب كيفية تصنيف TestData

سؤال -هل من الممكن القيام بذلك باستخدام SVM أو NN؟ هل من شيء آخر ؟ -أي توصيات أخرى؟

المحلول

هناك العديد من خوارزميات التجميع الموجودة هناك ، والشبكة غارقة في المعلومات عنها وتطبيقات عينة. نقطة انطلاق جيدة هي إدخال ويكيبيديا على تحليل الكتلة التحليل العنقودي.

نظرًا لأن لديك تطبيق K-means ، يمكنك تجربة أحد المتغيرات العديدة لمعرفة ما إذا كانت نتائج أفضل (K-means ++ ربما ، ترى كما ذكرت SVM). إذا كنت تريد نهجًا مختلفًا تمامًا ، فقم بإلقاء نظرة على خرائط Kohonen - تسمى أيضًا خرائط ميزة التنظيم الذاتي. إذا كان ذلك يبدو صعبًا للغاية ، فسيكون من السهل تنفيذ التجميع الهرمي البسيط (ابحث عن أقرب عنصرين ، يجمعون ، وشطفه وتكراره).

نصائح أخرى

هذا يبدو وكأنه مشكلة التجميع الكلاسيكية. لن تكون SVMs أو الشبكات العصبية قادرة على حل هذه المشكلة مباشرة. يمكنك استخدام أي منهج ل تخفيض الأبعاد, ، على سبيل المثال لتضمين بياناتك العشرة الأبعاد في الفضاء ثنائي الأبعاد ، لكنها لن تضع البيانات في مجموعات لك.

هناك عدد كبير من خوارزميات التجميع إلى جانب K-Means. إذا كنت تريد اتباع نهج متناقض ، فقد ترغب في تجربة ملف التكتل التجميع خوارزمية. لا أعرف نوع بيئة الحوسبة التي تستخدمها ، لكني أحب ذلك تمامًا ص و هذا (جدا) دليل قصير على التجميع.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow