موارد/مقدمات المبتدئين لخوارزميات التصنيف [مغلقة

https://stackoverflow.com/questions/2750105

02-10-2019
|

سؤال

الجميع. أنا جديد تمامًا في موضوع خوارزميات التصنيف ، وأحتاج إلى بعض المؤشرات الجيدة حول مكان بدء "القراءة الخطيرة". أنا الآن بصدد اكتشاف ذلك ، ما إذا كان التعلم الآلي وخوارزميات التصنيف الآلي يمكن أن يكون أمرًا مفيدًا لإضافته إلى بعض تطبيقات الألغام.

لقد قمت بالفعل بمسح ضوئي "كيف تحلها: الاستدلال الحديث" بقلم Z. Michalewicz و D. Fogel (على وجه الخصوص ، الفصول حول المصنفات الخطية باستخدام شبكات الخلايا العصبية) ، وعلى الجانب العملي ، أبحث حاليًا من خلال Weka Toolkit مصدر الرمز. ستكون خطوتي التالية (المخطط لها) هي الغوص في عالم خوارزميات تصنيف بايزي.

لسوء الحظ ، أنا أفتقر إلى أساس نظري خطير في هذا المجال (ناهيك عن استخدامه بأي شكل من الأشكال حتى الآن) ، لذلك سيكون موضع تقدير أي تلميحات إلى مكان النظر بعد ذلك ؛ على وجه الخصوص ، سيكون مقدمة جيدة لخوارزميات التصنيف المتاحة مفيدة. كونه أكثر حرفية وأقل من خبير نظري ، كلما كان ذلك أكثر عملية ، كان ذلك أفضل ...

تلميحات ، أي شخص؟

المحلول

لقد وجدت دائما دروس أندرو مور لتكون مفيدة جدا. إنهم يستندون إلى نظرية إحصائية صلبة وسيكونون مفيدين للغاية في فهم الأوراق إذا اخترت قراءتها في المستقبل. هذا وصف قصير:

وتشمل هذه خوارزميات التصنيف مثل أشجار القرار ، الشباك العصبية ، مصنفات بايزي ، آلات المتجهات الداعمة والتعلم القائم على الغلاف (المعروف أيضًا باسم غير البارامترية). وهي تشمل خوارزميات الانحدار مثل الانحدار متعدد الحدود متعدد المتغيرات ، المريخ ، الانحدار المرجح محليًا ، GMDH والشبكات العصبية. وهي تشمل عمليات تعدين البيانات الأخرى مثل التجميع (نماذج الخليط ، K-Means و Hierarchical) ، شبكات Bayesian وتعلم التعزيز

نصائح أخرى

ال الإجابة في إشارة إلى دروس أندرو مور هو جيد. ومع ذلك ، أرغب في زيادة ذلك من خلال اقتراح بعض القراءة حول الحاجة التي تدفع إنشاء العديد من أنظمة التصنيف في المقام الأول: تحديد العلاقات السببية. هذا وثيق الصلة بالعديد من مشاكل النمذجة التي تنطوي على الاستدلال الإحصائي.

أفضل مورد حالي أعرفه للتعرف على أنظمة السببية والتصنيف (وخاصة المصنفات البايزي) كتاب يهودا بيرل "السببية: النماذج والتفكير والاستدلال".

نظرة عامة على التعلم الآلي

للحصول على نظرة عامة جيدة على الحقل ، شاهد محاضرات الفيديو من دورة التعلم الآلي أندرو نغ.

توفر هذه الدورة (CS229) - التي يدرسها البروفيسور أندرو نغ - مقدمة واسعة للتعلم الآلي والتعرف على الأنماط الإحصائية. تشمل الموضوعات التعلم الخاضع للإشراف ، والتعلم غير الخاضع للإشراف ، ونظرية التعلم ، والتعلم التعزيز والتحكم التكيفي. كما تتم مناقشة التطبيقات الحديثة للتعلم الآلي ، مثل التحكم الآلي ، واستخراج البيانات ، والملاحة المستقلة ، والمعلوماتية الحيوية ، والتعرف على الكلام ، ومعالجة بيانات النص ومواقع الويب.

المصنفات

بالنسبة إلى المصنف الذي يجب عليك استخدامه ، أوصي أولاً بالبدء بـ دعم آلات المتجهات (SVM) لمهام التصنيف التطبيقية العامة. سيعطيك أداءً على أحدث الأداء ، ولا تحتاج حقًا إلى فهم كل النظرية وراءهم لاستخدام التنفيذ الذي توفره حزمة مثل Weka.

إذا كان لديك مجموعة أكبر من البيانات ، فقد ترغب في المحاولة غابات عشوائية. هناك ايضا التنفيذ من هذه الخوارزمية في ويكا ، ويتدربون أسرع بكثير على البيانات الكبيرة. على الرغم من أنها أقل استخدامًا على نطاق واسع من SVMs ، إلا أن دقتها تميل إلى مطابقة أو تطابق الدقة التي يمكن أن تحصل عليها من واحدة تقريبًا.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow