Frage

alle. Ich bin auf das Thema Klassifikationsalgorithmen völlig neu und brauchen ein paar gute Hinweise darüber, wo einige „ernsthafte Lesung“ zu starten. Ich bin jetzt in dem Prozess, herauszufinden, ob maschinelles Lernen und automatisierte Klassifikationsalgorithmen könnten eine lohnenswerte Sache zu einige Anwendungen von mir hinzuzufügen.

ich bereits gescannt durch „wie es zu lösen: Moderne Heuristik“ von Z. Michalewicz und D. Fogel (insbesondere die Kapitel über lineare Klassifizierer neuronale Netze verwendet wird), und auf der praktischen Seite ich bin derzeit der Suche durch die WEKA Toolkit Quellcode. Mein nächster (geplant) Schritt zu tauchen Sie ein in das Reich der Bayes-Klassifizierungsalgorithmen wäre.

Leider bin ich eine ernsthafte theoretische Grundlage in diesem Bereich fehlt (geschweige denn, sie in irgendeiner Weise als der noch genutzt haben), so dass alle Hinweise auf, wo neben aussehen würde geschätzt; Insbesondere wäre eine gute Einführung der verfügbaren Klassifikationsalgorithmen hilfreich. Als mehr Handwerker und weniger Theoretiker, die praktischen, desto besser ...

Hinweise, anyone?

War es hilfreich?

Lösung

habe ich immer Andrew Moores Tutorials sehr nützlich sein. Sie sind in solider statistischer Theorie geerdet und werden sehr nützlich für das Verständnis Papiere, wenn Sie wählen, um sie in der Zukunft zu lesen. Hier ist eine kurze Beschreibung:

Dazu gehören Klassifikation Algorithmen wie Entscheidungsbäume, neuronale Netze, Bayes Klassifizierer, Support Vector Machines und verrohrten basierte (aka nicht-parametrisch) Lernen. Dazu gehören Regression Algorithmen wie multivariate Polynomregression, MARS, Regional Gewichtete Regression, GMDH und neurale Netze. Und sie sind andere Daten Bergbau wie Clustering (Mischungsmodelle, k-means und hierarchisch), Bayes-Netzwerke und Reinforcement Learning

Andere Tipps

Die Antwort mit Bezug auf Andrew Moores Tutorials ist gut . Ich möchte es vermehren, jedoch durch einige Lesung über die Notwendigkeit, was darauf hindeutet, das die Schaffung von vielen Klassifikationssystemen in erster Linie antreibt: Identifizierung von kausalen Beziehungen. Dies ist relevant für viele Modellierungsprobleme die statistische Inferenz.

Die beste aktuelle Ressource Ich kenne für das Lernen über Kausalität und Sichter Systeme (insbesondere Bayes-Klassifizierer) ist Judea Pearl Buch "Kausalitäts. Modelle, Argumentation und Schlussfolgerung"

Überblick über Maschinelles Lernen

Um einen guten Überblick über das Feld zu bekommen, beobachten Sie die Video-Vorlesungen von Andrew Ng Machine Learning Kurs .

Dieser Kurs (CS229) - gelehrt von Professor Andrew Ng - bietet eine umfassende Einführung in Maschinelles Lernen und statistische Mustererkennung. Themen umfassen wachtes Lernen, unüberwachtes Lernen, Lernen der Theorie, Verstärkungs Lernen und adaptive Steuerung. Aktuelle Anwendungen des maschinellen Lernens, wie zu Robotersteuerung, Data Mining, autonome Navigation, Bioinformatik, Spracherkennung und Text-und Web-Datenverarbeitung werden ebenfalls diskutiert.

Sichter

Wie bei dem Klassifikator Sie verwenden sollten, würde ich empfehlen, zuerst mit Start Support Vector Machines (SVM) für allgemeine angewandte Klassifikationsaufgaben. Sie geben Ihnen state-of-the-Art-Performance, und Sie nicht wirklich brauchen, um all die Theorie hinter ihnen zu verstehen, nur die von einem Paket wie WEKA bereitgestellt Implementierung zu verwenden.

Wenn Sie eine größere Datensatz haben, können Sie versuchen, href="http://en.wikipedia.org/wiki/Random_forest" rel="nofollow noreferrer"> Zufällige Wälder . Es gibt auch eine Implementierung dieses Algorithmus in WEKA, und sie Zug viel schneller auf große Daten. Während sie weniger breit als SVM verwendet, deren Genauigkeit neigt könnte man von einem bekommen übereinstimmen oder nahezu die Genauigkeit entsprechen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top