طرق التصنيف غير الخاضعة للرقابة المتاحة
-
20-09-2019 - |
سؤال
أقوم بإجراء بحث يتضمن "تصنيفًا غير خاضع للإشراف". في الأساس ، لديّ Trainset وأريد تجميع البيانات في عدد X من الفئات بطريقة غير خاضعة للإشراف. تشبه الفكرة ما يفعله K-Means.
دعنا نقول
Step1) الميزات هي matrice [1057x10] وأريد تجميعها في 88 مجموعة.
Step2) استخدم الفئات المحسوبة مسبقًا لحساب كيفية تصنيف TestData
سؤال -هل من الممكن القيام بذلك باستخدام SVM أو NN؟ هل من شيء آخر ؟ -أي توصيات أخرى؟
المحلول
هناك العديد من خوارزميات التجميع الموجودة هناك ، والشبكة غارقة في المعلومات عنها وتطبيقات عينة. نقطة انطلاق جيدة هي إدخال ويكيبيديا على تحليل الكتلة التحليل العنقودي.
نظرًا لأن لديك تطبيق K-means ، يمكنك تجربة أحد المتغيرات العديدة لمعرفة ما إذا كانت نتائج أفضل (K-means ++ ربما ، ترى كما ذكرت SVM). إذا كنت تريد نهجًا مختلفًا تمامًا ، فقم بإلقاء نظرة على خرائط Kohonen - تسمى أيضًا خرائط ميزة التنظيم الذاتي. إذا كان ذلك يبدو صعبًا للغاية ، فسيكون من السهل تنفيذ التجميع الهرمي البسيط (ابحث عن أقرب عنصرين ، يجمعون ، وشطفه وتكراره).
نصائح أخرى
هذا يبدو وكأنه مشكلة التجميع الكلاسيكية. لن تكون SVMs أو الشبكات العصبية قادرة على حل هذه المشكلة مباشرة. يمكنك استخدام أي منهج ل تخفيض الأبعاد, ، على سبيل المثال لتضمين بياناتك العشرة الأبعاد في الفضاء ثنائي الأبعاد ، لكنها لن تضع البيانات في مجموعات لك.
هناك عدد كبير من خوارزميات التجميع إلى جانب K-Means. إذا كنت تريد اتباع نهج متناقض ، فقد ترغب في تجربة ملف التكتل التجميع خوارزمية. لا أعرف نوع بيئة الحوسبة التي تستخدمها ، لكني أحب ذلك تمامًا ص و هذا (جدا) دليل قصير على التجميع.